見出し画像

【AIによる予測】予測マシンの世紀#26 第一部まとめ

こんにちは。シンラボ共同代表の草場です。

AIとの共同に関して、『予測マシンの世紀 AIが駆動する新たな経済』をまとめていきます。推理小説のようで、ドキドキワクワクです。

目次
はじめに―機械知能
安さはすべてを変化させる
第1部 予測
 第3章 魔法の予測マシン
 第4章 「知能」と呼ばれるわけ
 第5章 データは新しい石油
 第6章 分業の新たな形
第2部 意思決定(決断を解明する;判断の価値 ほか)
第3部 ツール(ワークフローを分解する;決断を分解する ほか)
第4部 戦略(経営層にとってのAI;AIがあなたのビジネスを変容させるとき ほか)
第5部 社会(AIと人類の未来)

第一部、予測についてみてきました。この4章分だけでも様々気付くことがありました。キーポイント(まとめ)を元に、振り返ります。

■魔法の予測マシンまとめ
まるで魔法のような予測マシン。

・予測とは、欠けている情報を補うプロセスである。予測とは、あなたが持っている情報を利用して、あなたが持っていない情報を作り出すことだ。予測は、未来に関する情報を生成するだけでなく、現在や過去に関する情報を生成することもできる。例えば、クレジットカードの不正使用、画像内の腫瘍の悪性度、iPhoneを持っている人が所有者であるかどうかなどが予測される。
・予測精度の小さな向上は、その影響を誤魔化すことができる。例えば、精度が85%から90%に向上したことは、98%から99.9%に向上したことの2倍以上の効果があるように見る(2%に対して5%ポイントの向上です)。しかし、前者はミスが3分の1になったことを意味し、後者はミスが20分の1になったことを意味する。ミスが20分の1になるということは、環境によっては大きな変化をもたらす。
不足している情報を補うという一見平凡な作業が、予測マシンを魔法のように見せることができる。これは、マシンが見ること(物体認識)、ナビゲートすること(自動運転)、翻訳することなどですでに起こっている。

この章では、今まであった問題を「予測問題」と捉えなおして予測マシンを構成出来ることを学びました。これは本当に知能のように見えます。

■「知能」と呼ばれるわけまとめ
知能とは何か?なぜ知能のように見えるのか?を考察しました。

・機械学習科学は、統計学とは異なる目的を持っていた。統計学では平均的な正しさを重視するが、機械学習ではそれを求めない。その代わり、目標は運用上の有効性だ。予測に偏りがあっても、より良い結果が得られればよい。これにより、科学者は自由に実験を行うことができ、過去10年間に登場した豊富なデータと高速なコンピュータを活用した迅速な改善を推進した。
・従来の統計手法では、モデルの仕様を決めるために、仮説を明確にしたり、少なくとも人間の直感を必要とする。機械学習では、モデルに何を入れるかを事前に指定する必要性が低く、変数間の相互作用が多い、より複雑なモデルに相当するものに対応できる。
・近年の機械学習の進歩は、しばしば人工知能の進歩とも呼ばれているが、その理由は以下の通りである。その理由は、
(1)機械学習を用いたシステムが時間の経過とともに学習・改良されていくこと、
(2)特定の条件下では他の手法に比べて格段に精度の高い予測を行うことができること、
(3)予測精度の向上により、翻訳やナビゲーションなど、これまで人間の知能にしかできないと考えられていた作業を行うことができること、
などが挙げられる。私たちは、予測と知能の関連性については言及しない。我々の結論は、予測の進歩が知能の進歩を意味するかどうかについての見解には依存しない。私たちが注目するのは、予測コストの低下がもたらす結果であって、知能コストの低下ではない。

統計学を用いた予測から、機械学習を用いた予測に移行することで自由度が格段に上がりました。これはコンピューティングパワーが格段に上がったからです。知能に関しては定義が様々あるのでこの本では言及せずです。

■データは新しい石油
機械学習を進める上で、データが全てです。

・予測マシンは、3種類のデータを利用する。1)AIを学習させるためのトレーニングデータ、(2)予測を行うための入力データ、(3)予測精度を向上させるためのフィードバックデータ。
・データ収集にはコストがかかり、投資となる。データ収集のコストは、どれだけのデータを必要とするか、収集プロセスがどれだけ邪魔になるかによって異なる。データ収集のコストと予測精度の向上というメリットのバランスをとることが重要だ。最適なアプローチを決定するには、データの種類ごとにROI(投資収益率)を見積もる必要がある。
・データが多いほど価値があるかどうかは、統計的および経済的な理由によって決まる。統計学の観点からは、
データは収穫逓減型だ。データが1つ増えるごとに、それ以前のデータよりも予測が改善されるが、10個目の観測は1000個目よりも予測が改善される。
経済学的には、この関係は曖昧だ。例えば、データを追加することで、予測マシンの性能が、使えない状態から使える状態になったり、規制の性能基準を下回る状態から上回る状態になったり、競合他社よりも悪い状態から良い状態になったりした場合には、既存の大量のデータストックにデータを追加する方が、少ないデータストックに追加するよりも大きな効果がある。
このように、組織は、データの追加、予測精度の向上、価値創造の増大の関係を理解する必要がある。

データが大事、ということはよく聞きます。どういうデータか?が大事でした。ゴミのようなデータは価値がありません。さらに、経済学的な観点から考えると、新たなデータの追加が予測マシンの価値を高めることがあります。ここがポイント。

■分業の新たな形まとめ
予測マシンの精度が上がり、人間がマシンとどのよに協力できるかを見てきました。

・プロの専門家を含む人間は、特定の条件の下では予測がうまくいかない。人間はしばしば顕著な情報を偏重し、統計的特性を考慮していない。多くの科学的研究が、様々な職業におけるこの欠点を証明している。この現象は、長編映画「マネーボール」にも描かれている。
・予測という観点では、マシンと人間にはそれぞれ長所と短所がある。予測マシンが進歩すれば、それに合わせて人間とマシンの役割分担を調整しなければならない。予測マシンは、特にデータが豊富な環境では、異なる指標間の複雑な相互作用を考慮することにおいて、人間よりも優れている。このような相互作用の次元数が増えれば増えるほど、人間が正確な予測を行う能力は、特にマシンに比べて低下する。しかし、データを生成するプロセスを理解することで予測が有利になる場合、特にデータが少ない環境では、人間はマシンよりも優れていることが多い。ここでは、適切な分業を予測するのに役立つ、予測設定の分類法(既知の既知、既知の未知、未知の既知、未知の未知)について説明する。
・予測あたりのユニットコストは、頻度が高くなるにつれて下がる。人間の予測は、同じようにはスケールしない。しかし、人間は世界がどのように機能するかについての認知モデルを持っているため、少量のデータに基づいて予測を行うことが出来る。つまり、マシンは日常的なデータに基づいて予測を行うが、稀な出来事が起こると、マシンは自信を持って予測を行うことができないことを認識し、人間の助けを求める。人間が例外的に予測を行うのだ。

人間とマシンの強み、弱みを把握し、補完しあうことが大事です。特に人間は、少量のデータでの予測が得意なので、まだまだ出来ることがありそうですs。

本日はここまで。

明日から、いよいよ意思決定に予測マシンをどう使うかを見ていきます。

草場壽一
https://sinlab.future-tech-association.org/


この記事が気に入ったらサポートをしてみませんか?