【AIと意思決定】人間はモデリングに注力すべし!!『予測マシンの世紀 第二部』#16
こんにちは。シンラボ共同代表の草場です。
AIとの共同に関して、『予測マシンの世紀 AIが駆動する新たな経済』をまとめていきます。推理小説のようで、ドキドキワクワクです。
目次
はじめに―機械知能
安さはすべてを変化させる
第1部 予測
第2部 意思決定(決断を解明する;判断の価値 ほか)
第七章 決定を解明する
第八章 判断の価値
第九章 判断を予測する
第3部 ツール(ワークフローを分解する;決断を分解する ほか)
第4部 戦略(経営層にとってのAI;AIがあなたのビジネスを変容させるとき ほか)
第5部 社会(AIと人類の未来)
第二部、決断に関してです。昨日の記事は以下です。
■判断を予測する
昨日は、データが少ない状況、既知の未知に対しては、人間が予測マシンよりも優れていることを見てきました。
「予測マシンは珍しい出来事を予測するのは苦手だろう」という指摘は変わらない。当分の間は、人間が予測し、異常な状況が発生したときに判断する役割を担うことになるだろう。
問題は未知の既知です。
こういった状況では、無作為化対照試験をする必要がありました。実際、GoogleやCapital Oneなど、データを駆使する企業では、こうした実験が意思決定の原動力となっています。
そして、、、マシンも実験を行うことが出来ます。状況が十分に発生する限り、実験を行う能力は人間に特有のものではありません。
となると、やはり人間は追いやられるのか?
マシンは、人間と同じように実験を行い、何が何を引き起こすかを予測できるようになる。現在、マシンがさまざまなビデオゲームで人間を凌駕できるようになったのは、この点が重要な意味を持っている。
DeepMindのAlphaGoが囲碁のチャンピオンを破って以来、AIはさら発展しており、Atariというゲームでも人間を上回っています。
実験は、もはや人間に特化したものではありません。
人間に残されているとしたら、未知の既知で見てきた、モデリングです。
実験に代わるモデリングでは、状況と観察されたデータを生成したプロセスを深く理解する必要がある。特に、状況が頻繁に起こらないために実験ができない場合や、実験のコストが高すぎる場合に有効だ。
実験困難な場面で、モデリングの能力が活きてきます。報酬機能工学でみてきたオンライン求人情報サイト「ZipRecruiter」を例に、本では説明されています。
ZipRecruiterが決めなければならなかったのは、自社サービスを企業にいくら請求するか?という点でした。
オンライン求人情報サイト「ZipRecruiter」の「ベストプライスを見つける」という決断には、2つの部分があった。
まず、「最適」とは何を意味するのか、短期的な収益なのか、長期的なものなのか。求職者が増えて広告主が増えるのか、それとも価格が高くなるのか。
2つ目は、具体的な価格を決めることだ。
2つ目の問題は、実験を行って解決されました。この実験の設計は人間が行いましたが、AIが進歩すれば、十分な広告主と十分な時間があれば、このような実験は自動化できます。
しかし、「最適」を判断するのは、自動化するのがより困難です。
求職者の数は求人広告の数に依存し、その逆もまた然りなので、全体の市場は1つの観測値しかない。これを間違えると、ZipRecruiterは廃業してしまう。
そこで、ZipRecruiterは自社のビジネスをモデル化しました。
短期的な利益を最大化した場合の結果を調査し、より長い時間をかけて利益を最大化することを目標とした代替モデルと比較した。データがなければ、結果のモデル化や報酬関数のエンジニアリングは、高度な技術を要するとはいえ、人間の能力のままだ。
何をベストとするかを明確にするために、別の状況を取り込んだ代替モデルを作ると。そのモデル作成には、人間のみが出来るのです。これは朗報かも。
本では、モデル化に関して具体例が出てきます。
第二次世界大戦時、爆撃機の装甲が改善できるようになりました。問題となったのが、防御の部分です。爆撃機のどの部分を強化すれば、爆撃機を守れるか?これは実験は可能ですが、失敗するとパイロットは命を落とします。そこでモデル化が活躍します。
戦闘から帰還した爆撃機が、「どの部分に攻撃を受けたか」は機体にある弾痕を見ればわかります。これがデータとなります。では、機体が攻撃を受けた場所が爆撃機を守るために必要な場所だったのでしょうか?
ここで、統計学者のエイブラハム・ウォールドが登場します。彼の出した結論は以下ですs。
彼は「弾痕のない場所を守れ」と言った。彼は混乱していたのだろうか?矛盾しているように思えた。
彼はデータを生成するプロセスのモデルを持っていた。彼は、戦場から戻ってこない爆撃機があることを認識しており、それらの爆撃機は致命的な場所に被弾したのではないかと推測した。一方、帰還を果たした爆撃機は、致命的ではない場所に被弾していた。その結果、空軍の技術者たちは、弾痕のない部分の装甲を厚くして、飛行機の防御力を高めた。
ウォールドさんは、以下のモデルを仮定したわけです。
戦場から帰還しない→致命的な場所に爆撃を受けた
戦場から帰還する→致命的な場所に爆撃を受けなかった→爆撃機が被弾している場所は強める必要がない。
そのため、被弾していない場所を強化する必要がある。
ウォールドの「データがない」という洞察には、「データがどこから来たのか」という理解が必要だが、この問題は過去に発生したことがないため、技術者には過去の事例がない。このような計算は、当面は予測マシンの能力を超えたものになるだろう。
データがどこから来たのかを理解しモデル化する、これが人間が予測マシンよりも優れた点のようです。
ウォールドは、統計学の数学を深く理解し、データを生成するプロセスを理解できる柔軟な頭脳を持っていたた。
データを生成するプロセス理解、当面はここを磨く必要がありそうです。
人間はトレーニングによってそのようなモデリングスキルを身につけることができる。これは、ほとんどの経済学博士課程の中核的な側面であり、多くの学校のMBAカリキュラムの一部だ。このようなスキルは、予測マシンを扱う際にも重要だ。そうでないと、未知の可能性の罠に陥りやすくなる。予測が何をすべきかを教えてくれていると思うかもしれないが、原因と結果が混ざってしまい、道を踏み外してしまう。
モデリング、勉強します。ちょっと混乱してきたので、再度。
人間の行動について優れたモデルがあれば、人間の意思決定によってデータが生成されたときに、より良い予測を行うことが出来る。当面は、人間がこのようなモデルを開発し、行動の関連する予測因子を特定する必要がある。予測マシンは、データがない状況では、行動が変化する可能性が高いため、推測するのに苦労するだろう。そのためには、人間を理解する必要がある。
再度、モデル化の勉強、必須ですね。
もう一点、人間が予測マシンに勝っている点は、今までやったことのないことを「こうしたらどうなるだろう」と考える意思決定です。
ある製品ラインに新製品を追加するべきか?
競合他社と合併すべきか?
革新的な新興企業やチャネルパートナーを買収すべきか?
もし我々が変化の後に異なる行動をとるならば、過去の行動は将来の行動の有用な指針とはならず、予測マシンは、関連するデータを持っていないことになります。
データを生成するプロセスを理解するためのモデリング能力
今までにやったことがないことがある際の意思決定
力を注いでいきます。
この記事が気に入ったらサポートをしてみませんか?