統計学の「主義」批判に渡辺ベイズは一切必要なく、そこには一般的な記号操作におけるリテラシーの問題しかないのではないか

 ツイッター上で統計学の「主義」論争が先月からずっと続いているが、なぜか「主義」擁護側は批判者に対して「渡辺ベイズ主義」とレッテルを貼っているらしい。例えば僕なんかは渡辺ベイズの結果を一切使わず「主義」批判をしているし、統計学の「主義」がおかしなものであると指摘するにはこの立場で十分過ぎるだろう。情報量規準("基準"ではない!)がどうとか真の分布がどうとかなんて本質的でない話を持ち出す必要は全く無い。

 後の議論で混乱を生まないよう、「ベイズ主義」について整理しておこう。少なくともツイッター上で「ベイズ主義」と呼ばれるものはふたつあり、擁護者の多くはこの違いに気付いていない。自覚的に混同し、議論を混乱させる者までいる始末だ。ひとつは、確率は「主観的」であるという内在主義的主張を「ベイズ主義」とし、「頻度主義」を外在主義と紐付けるものだ(ツイッターを眺める限りはこちらが多数派らしい)。この主張については下の記事で批判した通り、統計的手法と確率の内在性/外在性は全く対応していないから、ベイズ主義/頻度主義と内在主義/外在主義は完全にデタラメな対応づけである。そんな間違えまくった対応づけは行わず、統計学とは関係のないところで単に「確率の内在主義」として研究すればよい。

ほとんど同じ批判が哲学方面からも出ていたのでリンクを張っておく。

明らかにもう一方の「ベイズ主義」の立場に立っているにもかかわらず、内在性/外在性の対比による「ベイズ主義」をなぜか擁護していたり、仲間のように扱っている悪質な統計学者が議論を混乱させている。彼らは「それは自分たちの言うベイズ主義ではない」と言って跳ね除けるべきなのだが、なぜか意図的にふたつを混ぜ込んだかたちで擁護を行っている。これをどうにかしない限り、哲学側のお粗末な議論の流れ弾を食らって批判されても仕方がないだろう。尻拭いをする覚悟がないのなら、きちんともう一方の「ベイズ主義」を批判すべきである。

 とはいえ、もうひとつの「ベイズ主義」はさらに酷い。恐ろしいことにこれは統計学の世界でよく受け入れられたスタンダードなものらしい。トップジャーナルや米国統計学会で受け入れられている主張だから正しいのだと無意味な擁護をする思考停止人間を何人か見たが、何の反論にもなっていないし、単純にその分野は死んでるんだろうなご愁傷様としか思わない。僕は最初に統計学者が前者の「ベイズ主義」を主張しているのかと思っていたので上記のような「当たり前の」批判をしてしまったが、これはもっと手前の「当たり前以前の」批判で対処できる。あまりに馬鹿らしすぎてこのことに気づくのに少し手間がかかってしまった。もうひとつの「ベイズ主義」は(彼らの言葉をつなぎ合わせて書くとすれば)「ある合理的な意思決定エージェントの主観情報として確率分布を解釈する」立場らしい。細部は違うかもしれないので気づいた人は指摘してほしいが、それはこの後の批判に本質的な変更が加えられるような類の違いではないだろう。「ベイズ統計の理論を主観情報を仮定した意思決定のモデリングに利用することができる」という比較的穏当な立場ですらない。もしそのような立場であれば、「統計学に主義は存在しないが、統計学を何かへ応用するにあたって"見方の違い"が存在する」と言うはずだし、「事前分布は主観分布」などという支離滅裂な主張は口が裂けても言えないはずである。

 「事前分布は主観分布」だという説明のどこが決定的におかしいかというと、「事前分布」という理論的対象をその解釈で説明してしまうという捻れが生じてしまっているというところだ。事前分布は事前分布であってそこには解釈も何もないのは当然であって、"解釈"するとすれば何らかの計算が終わった後に「ここで事前分布は主観分布とする」として、そうした場合の計算結果の解釈を個別に行えばよい。そもそも、現実の概念それ自体との対応物でもない単なる記号操作を何かだと思うことなどできるはずがない。理論とはあくまでも現実の何かを代入したとき計算結果に大きな不都合が生じないから計算結果にも代入時の"解釈"を引き継げるというだけで、その理論的対象自体が現実のそれである、と混同してしまってはいけない。事前分布は事前分布というただの記号列であり、input に「主観分布」という解釈を入れても結果に大きなエラーが生じないから output に一貫した解釈を適用してもいいのである。

 それもひとつの「主義」では? という声もあるだろうから、上記のような考え方をしないと「おかしい」ということを確認しておこう。

 例えば、Lotka-Volterra 方程式というものがある。これは生物の捕食/被食関係による個体数の変動を表現するために利用されることが多い方程式だ。修士の頃に単位が足りなくて慌てて受けた集中講義で紹介されたので強く印象に残っている。さて、この方程式は「生物の捕食/被食関係による個体数の変動」を表す方程式だろうか? そんなことは絶対になくて、Lotka-Volterra 方程式はある決まった定義を持つ「Lotka-Volterra 方程式」でしかないのだ。これを「生物の捕食/被食関係による個体数の変動」を表す方程式とするのは完全に順序を間違えていて、その言葉でこの方程式を説明するのは間違いだということは当然にわかるはずだ。「生物の捕食/被食関係による個体数の変動」という解釈を代入しても不都合が起きない場合においてその計算結果に解釈を引き継ぐことができるという、ただそれだけのことなのだ。Lotka-Volterra 方程式という単なる微分方程式でしかないものを見て「生物の捕食/被食関係による個体数の変動を表す方程式」と言ってしまう人間がいたら、ちょっとまともなリテラシーがあるのか疑ってしまうだろう。少なくとも、そいつは自分が何を触っているのか全く理解していないということはわかる。

 もっと卑近な例で考えてみよう。「順序が違う」とはどういうことか。バナナを皿に加えていこう。僕はバナナが食べられないが、上記ツイートでなぜか咄嗟にバナナを例に出してしまったので不本意ながらこのシチュエーションでいく。現在皿にあるバナナは2本で、このことを表すために初期値を「2」としておく。これはバナナ2本を表現するために「2」という自然数モデルを現実にフィッティングしただけであって、「2」を「バナナ2本」と解釈することはできない。ただ、この世界にフィッティングした「2」という自然数モデルに「バナナ2本」という"解釈"を「代入」することはできる。10分ごとに1本のバナナが皿に追加されるとしよう。1時間後のバナナの本数にフィッティングした自然数モデルの計算結果は「8」となる。ここで、自然数モデルの input に「バナナの本数」という"解釈"を代入することで計算結果から「バナナ8本」という解釈を取り出してもよいということが初めて確認される。我々が扱っているのはバナナの本数を表す演算ではなくあくまでもそれにフィッティングした自然数モデルのほうなので、例えばここに含まれる「2」を先に「バナナ2本」と説明してしまうことで後の計算の正当性は全く保証されなくなってしまう。そもそも記号操作を解釈ベースですること自体が「主義」どうこうの問題ではなく「不可能」なのだ。そんなことは人類史上おそらく一度も達成されたことはないし、これからも成功することは原理的にありえない。

 上に挙げた例だと多くの人が理論的対象の解釈による説明は「論外」だとわかってくれると思うが、統計学ではどうもそうはいかないらしい。恐ろしいことに、「ベイズ主義」などという「論外」な主張が幅をきかせている。「事前分布は主観分布」という主張が上記のような「論外」な場合の説明と同レベルだと指摘されて「藁人形論法」だと感じてしまう者がいるなら、さすがに自分たちが触っているものについてあまりにも何もわかっていなさすぎるのではないかと思う。彼らには、記号操作と現実世界の間にある豊かな世界が「潰れて」見えていて、それを平気で無かったことにしてしまうのだ。これはかつての不完全性定理の濫用にも通じる問題であり、数学界隈の一部が今回の件で特に警戒しているのもそういった濫用の歴史があるからだろう。

 少し話は変わるが、「ベイズ主義」の統計学者に「事前分布は主観分布」という主張を正当化する根拠を聞いたところ、サヴェジを読めと言われた。指定された箇所を軽く読んでみたが、完全に時間の無駄でしかなく絶望してしまった。どんなアクロバティックな方法を使えば「公理的に」理論的概念の解釈を正当化できるのかとワクワクしていたのだが、そこには選好順序についての諸々の条件が列挙されているだけで、どこにも何の正当化根拠も書かれていなかった。これを読んで何をどう批判すれば良いというのだろう。彼らは自分でも何を根拠として何を正当化しているのか全く理解していないのではないか。これが「主観測度の存在を証明した」などと説明している地獄のような異常文献も見かけたが、選好順序についての諸々の条件を並べることで何を証明したというのか(体感でしかないが、統計学者には「証明」でないものを「証明」と呼ぶ人間は多いように見える)。そういう条件を満たす確率測度が存在することがわかり、当該の確率測度はそのような行動をとる主体のモデリングに有用だということがわかったとして、「事前分布は主観分布」などという説明の正当化には何も寄与しない。「公理」という言葉が出てくれば、何やら数学的にうまいこといったらしいぞ、と思ってしまう残念な人々がたくさんいるということなのだろうか。

 そういった「モデリングの有用性」をいくら並べ立てても、事前分布は「事前分布」という何らかの記号列で定義された理論的対象の立場から一歩も出るわけがなく、決して「主観分布」と解釈されることはない。「事前分布」という記号を操作する我々に唯一可能なのは、現実世界をそういった記号によってモデリングすることだけである。そこにあるのは一貫した概念の「解釈」ではなくあくまで input と output への解釈の「代入」であり、これですら個々の分析者や哲学者の仕事であって「統計学」の理論が責任を負うものではない。理論に解釈の仕事を紛れ込ませた途端に、理論は理論としての一般性や正当化根拠の一切を失い、瞬く間に崩れ落ちてしまう。

 これくらいの感覚は1秒でも数式を扱ったことがあれば当然に身に付くだろうと思って書くのを躊躇ったが、当たり前のことでも記録しておくことは重要だなと思い直したので乱文ながら書いてしまった。ましてや現実のデータを扱う人間がこんな初歩的なことを間違えていては取り出せる「解釈」も取り出せまい。

 とりあえず、今後「事前分布は主観分布」などと言う有害な学者がいれば「"2"は"バナナ2本"ではない」 と当たり前のことを言うだけで済むだろう。こんな程度の低い議論に対して長い記事を書く暇があるなら粛々と学問をやった方がいいとはわかっているのだが……。

この記事が気に入ったらサポートをしてみませんか?