見出し画像

全人類が学ぶべき道具「ベイズ理論」

引き続き『人はどこまで合理的か 上』からの知見。

今回は、ピンカーが最も有効な合理的思考の一つとして紹介している「ベイズ推論」です。その前に確率論と利用可能性ヒューリスティックについて、興味深い紹介をしているので、まずはそちらから。

■偶然性・不確実性を数字で認識する

よくよく考えてみると、この世の中は、合理的に説明できることの方が希少で、そのほとんどは偶然性と不確実性に支配されていることがわかります。

なので、ソクラテスがいうように「不知の自覚(昔は「無知の知」といった)」が大切なのです。「わからないことは、わからない」と自覚する、ということです。

一方で「わかりきっていること」と「まったくわからないこと」の間には膨大な「なんとなくそうじゃないか」「例外は多いがおおよそは大体はこんなところだ」という状態があります。

この状態のことは、確率で説明できるんじゃないか、というのが「確率論」です。そして「まったくわからない」というのが「ランダム性」。

確率論で説明できることは「割合」で数値化し、「ランダム性」で説明できることは「わからない」と自覚することが、ある意味「合理的思考である」とピンカーが提言しているのです。

■利用可能性ヒューリスティック

ところが、人間には心理的に「確率論→数値化」や「ランダム性の自覚」などの合理的思考を阻害する本能を持っています。これは行動経済学でいうところの反射的思考(「システム1」と呼ばれている)で、大概は、システム1は人間の認知に有効な思考なんですが、たまにエラーを起こすのです。それがバイアス(錯誤という名のエラー)。

中でも過去にも紹介したバイアス「利用可能性ヒューリスティック」は、行動経済学が発見した最も重要なバイアスのひとつ。

19世紀に主に西欧で民主主義が台頭して以降、歴史上はじめてデータが公共財とみなされて以降、日本でも内閣府をはじめ、行政機関はもちろん民間の研究所含め、あらゆる団体・個人がデータをネット上に公表してくれています。

ところが私たちはいまだに、データを活用せず本能(システム1)にしたがって物事を判断してしまっています。中でも「印象の強さ」で物事を判断してしまうバイアスが「利用可能性ヒューリスティック」。

ピンカー曰く

わたしたちは脳の検索エンジンを動かして、その検索結果の順位を最善の確率推定とみなしている。

この検索順位は、合理的な順位ではなく「印象の強さの度合い」に基づく本能的な順位。「印象の強さ」とは、感情に訴えかける強さ、自分の身の回りによく起きること、近い過去のこと、希少性の高いこと(ニュース性の高いこと)など、です。

このうち「ニュース性の高いこと」に関してはマスコミの影響は強く、マスコミに取り上げられる物事は私たちに「印象の強さ」として大きく影響します。よくいう「犬が人を噛んでもニュースにならないが人が犬を噛んだらニュースになる」というヤツです。

ピンカー曰く

報道機関は「利用可能性」を生み出す機械だということである

でもマスコミが悪いわけではありません。より多くの人に視聴して読んでもらわないと彼ら彼女らの商売は成り立たないからです。大事なのは「マスコミとはそういうものだ」と私たちがちゃんと認識することです。

以下、本書で紹介されているアメリカの利用可能性ヒューリスティックの事例。

*「喘息」と「竜巻」による死者数はほぼ同数だが、喘息による死者は報道されない。

*移民の割合は12%しかないのに、28%ぐらいと多くのアメリカ人が思っている

*自動車による死者数は、飛行機による死者数の1000倍なのに多くのアメリカ人は、飛行機のほうが危険と思っている。

*テロによる死者は年間数十人で、蜂に刺されて死んだ人とほぼ同数しかいないのに、テロがきっかけで国土安全保障省が創設され、中東で二つの大きな戦争を起こし、911(3000人の死者)を超えるアメリカ人の死者に加え、数十万人のイラク人、アフガニスタン人の命が失われた。

残念ながら、私たちは、人間(ヒューマン)だから、利用可能性ヒューリスティックから逃れることはできません。このことは行動経済学の創始者の一人であるカーネマンも自分自身、この分野の研究をした後も「さして変わらない」といっています(このような謙虚さが素晴らしい)。

とはいえカーネマン自身は「エラーが起こりそうな状況を認識する能力だけは進歩した」といって、エラーは「知らないより知っていいる方がずっといい」としたわけです(以下著作「結論」より)

私たちも意識的思考を働かせて(行動経済学者カーネマンのいう「システム2」)、常に「数字で世の中を把握する」という合理的思考のクセを身につけることで、この厄介なバイアスから逃れることができる場合もあるのです。

■全人類が学ぶべき理性の道具「ベイズ推論」

【ベイズ推論とは】

やっとベイズ推論です。ピンカーは、ベイズ推論のことを「全人類が学ぶべき理性の道具」と絶賛しています。

実はベイズ推論に関してもサトマイ(の著作)の方が100倍わかりやすい。18世紀に生きた牧師トーマス・ベイズが「ある仮説に対する信頼の度合いは確率として定量化できる」という考えから生まれたベイズ推論。以下自分なりにサトマイの事例で整理しました。

本ブログでも過去にも何度も説明していますが、言語は生き物なので、自分がいま生きる環境(時間と空間と社会)にマッチした著作が一番わかりやすい。日本の一般庶民である私の場合、アメリカ人のピンカーより、日本人のサトマイの方がわかりやすいのは当然です。もちろん彼女自身の説明能力が高いというのもありますが。。。

サトマイに言わせれば「ゆるふわな統計学」とされたベイズ推論は、

答えはわからないけど、いったん仮決めをして、データを入れながら、その都度、修正していきましょう」という考え

『はじめての統計学』第7章

ピンカーは乳がんの事例で説明していますが、サトマイは最初にオオカミ少年の事例で説明。オオカミ少年の事例の方がわかりやすいので以下オオカミ少年の事例で整理。

「人物X」がいたとします。彼が嘘をつくかどうかは現時点では全くわかりません。「人物Xが嘘をつく可能性はどのぐらいでしょう」というのがお題。まずは人物Xが嘘をつくかどうかは全くわからないので、仮置きとして

最初の嘘をつく確率をとりあえず0.5①とします。

この仮置きのことを「主観確率」という
仮置きされた最初の確率を「事前確率」という

次に過去の調査結果を参照したところ、

*嘘つきが、本当のことを言う確率が0.2、嘘を言う確率が0.8
*正直者が 本当のことを言う確率が0.9、嘘を言う確率が0.1③   

ということがわかりました。

これを例えば「嘘つき」(正直者)という条件のもとで嘘をつく(本当のことを言う)確率だから「条件付き確率」という。

特に0.8は、嘘つきが正しい(=仮説)としたら、嘘つきが嘘をつく可能性(=データが得られる可能性)の数字で「データ尤度」という重要なデータ。

次に人物Xが「嘘をついた」という情報が得られたとします(新たな情報が追加)。そうすると、
「嘘つきが嘘を言った可能性」と「正直者が嘘を言った可能性」

の二つの可能性が考えられます。

*嘘つきが嘘を言った可能性は、   
        事前確率0.5①✖️条件付き確率0.8②=0.4

*正直者が嘘を言った可能性は、
        事前確率0.5①✖️条件付き確率0.1③=0.05

そうすると、
            嘘つき:正直者=0.4④:0.05

となり、ならすと8対1になります。

これを「オッズ比」という。

オッズ比と違い、確率は加算して1 にしないといけないので、計算すると

                    嘘つき0.9⑥:正直者0.1

となり、人物像Xが1回嘘をついたことで、人物Xが嘘つきの確率が

                  0.5①(事前確率)→0.9⑥(事後確率)
に更新しました。

人物Xが、嘘をついた情報を得て変わった確率を「事後確率」という

確率が更新したことを「ベイズ更新」という

そして更に人物Xが、また嘘を言ったとします。そうすると今度の事前確率は、ベイズ更新した90%⑥になります。そして最初と同じように計算すると次の事後確率は、なんと99%に上昇。

ちなみに『合理的思考』で紹介されている計算式では以下の通りで、本文では、より確度の高い「事前確率」のことを「基準率」と表現。

事後確率0.9
=事前確率0.5①✖️データ尤度0.8②➗周辺確率(=0.4④➕0.05⑤)

このように、ベイズ推論は、最初は「ゆるふわ」な主観確率であっても、情報をどんどん取り込むことで確率の精度が上がっていく、というのがポイント。

【ベイズ理論の重要性】

それでは、このようなベイズ推論をなぜピンカーが「全人類が知るべき」と絶賛したのでしょう。そして「ベイズ推定の思考方法を身につけさせることは教育の優先課題であるべき」とも上巻の最後で述べています。

なぜならベイズ推定の考え方を応用することで、合理的思考を妨げる数多あるエラーに気づくことができるからです。

なお、ベイズ推定のキモは、新しい情報をどんどん取り込むことで確度が上がっていくという考え方で、この考え方は、私たちがふだん利用しているAmazonのおすすめ機能や、Googleの検索順位、自動翻訳などのA Iの学習機能のしくみなど、最近の主要な情報系イノベーションにおいて応用されている、非常に重要な推定方法でもあります。

例えば、「驚きの事実」への冷静な判断。よくニュースの話題になる「驚きの事実」は、「驚き」とつくぐらいだから、可能性がうんと低い事実です。つまり事前確率が限りなく低い、ということです。だから「驚きの事実」は、よっぽど正確で間違いない事実が多くないと(=確率の高いデータ尤度による多数のベイズ更新)、とても信用できません。なのに私たちは、センセーショナルな「驚きの事実」にすぐに飛びついてしまい、多くの間違いを犯してしまう。

なぜなら私たち人間は、この事前確率をついつい無視しがちだから(カーネマン&トヴェルスキーの説)。

例えば上述のオオカミ少年の事例で言えば、嘘つきが嘘を言う確率(80%=データ尤度)にどうしても注目しがちで、実際には嘘つきは元々はどれほど嘘つきか(50%=事前確率)は、見落としがちだというのです。ピンカーはこれを「基準率無視」と呼んで、これが私たちが見落としがちなエラーだといいます(→代表性ヒューリスティックという)。

私たちが、がん検査で陽性になったときに、どうしてもがん患者が陽性になる確率(=データ尤度)に目が入ってしまい、日本人全員ががんにかかる率(=基準率)に目がいかなくなってしまうのです。

そして「驚きの事実(=基準率が極端に低い)」が本当に事実なら、その確率を上げるためには確率の高いデータ尤度による頻繁な更新(=途方もない証拠によるベイズ更新)が不可欠。

天文学者カール・セーガン曰く

途方もない主張には、途方もない証拠が求められる。途方もない主張は事前確率がとても低い。したがって、この仮説の事後確率が対立仮説の事後確率よりも高くなるためには、仮説が真である場合のデータの尤度が、仮説が偽である場合のデータの尤度よりもはるかに高くなければならない。つまり”途方もない証拠”が必要になる。


    【基準率に目がいかない、代表性ヒューリスティックの事例】
女子大生のリカは感性豊かな女性で、夏休みにはヨーロッパを旅行し、英語とフランス語を流暢に話す。まだ将来のキャリアプランはイメージしてないが、絵を描いたり友人の誕生日には短歌を詠んで贈ったりする。

さて、リカの専攻心理学美術史のどちらでしょう。

この場合、多くに人は「美術史」と回答するのですが、ベイズ推定の考え方からいえば、心理学の可能性の方が高い。

なぜなら美術史を専攻する人よりも心理学を専攻する人の方が圧倒的に多いから。つまり私たちは(心理学専攻の学生の方が多いという)基準率を無視してしまっているのです。

「科学の仮説検証」も、仮説の再現性を高めるためには、ベイズ推定に基づいて、事後確率が向上するよう、再実験に基づく確率の高いデータ尤度によるベイズ更新が必須なわけで「科学の信頼性もベイズ推論で数値化できる」ということです。

物理学者ジョン・ザイマン曰く

大学の物理学の教科書に載っている内容は90%が真だが、物理学の主要な研究誌に載っている内容は90%が偽である

同上

なので私たちも一体その仮説の精度(確率)はどの程度なんでしょう、というぐらいで受け止めていた方がいいのかもしれません。


*写真:船橋市「枝垂れ梅」2023年撮影


この記事が気に入ったらサポートをしてみませんか?