大塚淳『統計学を哲学する』読書メモ

2021年10月29日 18:24

『統計学を哲学する』という本を半年くらい前に購入した。

どうして「統計坊や」や「ロジハラ先生」がいくら統計データを提示しても他者を説得できないのか、もしかして統計というものには致命的な欠陥があるのではないかという問題意識から読み始めたのであった。

ところが内容をほとんど理解できず、私の問題意識などどこかへ行ってしまった。いまちょうど2周目が終わろうとしているところであるが、なんとか輪郭はつかめたというところである。さてあと何周すべきかなあと思ってたところで今朝このようなツイートを見かけた。

理系の皮を被った文系であり、またその逆でもある臨床医学の立場からは、「自然」とは畢竟unpredictableかつuncontrollableなもので、その"un-"にどのような態度で接するか、記述統計学や推計統計学的に接するのかベイジアン的に接するのかでそのグラデーションのどの辺りに位置するかが決まると思う。
— Noboru Hagino（Rheumatology） (@Noboru_Hagino) October 28, 2021

良いきっかけであるから、今のところ理解できたことだけまとめて、しばらく積んでおくことにした。1年後くらいにまた読んだらもう少し理解できるだろう。

本書は存在論と意味論と認識論を手がかりに統計学の背景に迫ろうという試みである。

そのために、まずベイズ統計と古典統計に分類して概説する。

ベイズ統計において、意味論としては、確率とは信念の度合いを表す指標である。その指標は主観的なものとならざるをえず、認識論的には、内在主義である。

これに対して古典統計は、確率は物事がおこる客観的な頻度の指標である。その根拠は客観的、あるいは主体の外にあるべきとされ、認識論的には外在主義である。こうした性格ゆえに検定理論が古典統計から生まれた。

臨床医学などはこの古典統計の検定理論に大きく依存している。しかしこの検定は、英語検定1級合格しました、という検定とはちょっと意味合いが異なる。ある仮説が、ある程度以上の確率で正しそうとか、間違っているとかいう外的な「信頼性」を「客観的に」表示しているにすぎない。

古典統計や検定理論が客観的であることが、反事実的想定を用いることとも関連している。回帰分析をやったことがある人はこの感覚は理解できるだろう。ただ、理屈として理解するのは非常に困難であった。

そもそもこういう理論を用いるのは、未来の予測をするためである。例えば、胃癌にある薬が効くとか効かないとか。そうすると、より良く予測できれば、その推論の過程はさほど問題ではないとか、自然界の真の法則とかいう大仰なものはさほど重要ではないことになる。

手元のデータから背景の事情を機能的に推測・修正していくのが、現実的な意味での統計学といえよう。しかしここで、自然の斉一性が前提されている。つまり、背景の事情は過去・現在・未来において普遍であるという前提である。

そうでなければ、TS-1と呼ばれる薬が胃癌に効くか効かないかという問い自体が無意味化してしまう。

もっともこういうことを言い出すと、同じ胃癌でも患者さんごとに違うという意見も出てこよう。それは癌細胞そのもののheterogeneityのことでもあるし、患者自身の身体的、社会的バックグラウンドの違いでもある。

この辺は、両群の患者背景に有意な差は認められなかったと言ってすませたりすることが多いようだ。もちろん本書を読んだ後ではこんな簡単な言明すら聞き逃すことはできないのであるが。

個別データごとの違いに関連する事項は、本書はAIやディープラーニングの章でもとりあげている。ビッグデータとかマシンラーニングとかいうものは、細かなデータの違いを大量に扱えるために、個々のデータセットに過剰適合してしまうのである。そうすると別のデータセットで正確に予測できないということになる。予測モデルを作る人々はよく知っていることであろう。

普通は変数が多ければ多いほど、正確に予測できると思われているが実はそうではない。適度に捨象したほうがいいことは多々ある。ひとりひとりの患者背景は違っても、胃癌と一括にしたほうがいいこともあるのだ。

正確性を削りつつも、自然の斉一性も前提にするというのが、いささかトリッキーに感じられる(私の誤読かもしれない)。

最初の方に、大数の法則とか確率種の話もあったがここらへんは割愛。

この記事が参加している募集

推薦図書

42,235件

サポートは執筆活動に使わせていただきます。