数学のありがたみ

今日は数学の確率論の期末試験が終わった。最初は基本の条件付き確率やベイズの法則から始まり、主に二項分布、ポアソン分布、正規分布などを経て期待値や変動の統計の初歩で習うような分野、それからマルコフ連鎖のあれこれ(マルコフ過程、定常分布、MCMC、分枝過程など)。やってる内容はどれも私にとって簡単ではなかったが、試験自体は授業や宿題で出た問題の類似だったので、真面目にやっていれば単位は取れる仕組みであった。実際みんな満点ぐらいだろう。

そんな簡単な試験でも試験は試験なので、ここ一週間ほどは前半の復習と、それまで自分の研究にかかりっきりで放ったらかしていたマルコフ連鎖全般をもう一度見直すことに時間を費やし、ほとんど実験のことは進まず。学部生でもないのに正直やりすぎな気もするが、それでも勉強してよかったなと思う。特にマルコフ連鎖はまだわかってないところが多いので、時間を見つけてもう一度考えられたらいいのだが。

そもそもこの数学の授業をとったのは、もともと履修してた計算認知科学の理解の助けになるかなと思ったのと、あわよくば三年生の分の授業をとってしまえれば来年何も取らなくてもいいかなという下心であった。結局計算認知科学の方が全くついていけなくなって履修を取り消し、確率論から単位をもらうことになったのだが。

私の数学遍歴はというと、大学受験時に理系だったので、一応高校レベルの数学は一通りやったかなという程度であり、大学では一年生の時に線形代数の初歩の単位をかろうじて取ったが微積は落とし、それ以降は一切数学とは無縁の人生を歩んで早十年である。

大学二回生の時に必修で心理統計の授業があったが、先生の方針として細かい数学は理解しなくていいということであった。当時、私は本当に数学が苦手だと思い込んでいたのでこの言葉にホッとし、統計学の基礎から検定など、先生の語る「お話」を聞いてわかったような気がし、全く真面目に勉強しなかったので試験は可を取った気がする。

時はしばらく過ぎ、イギリスの大学院に戻った2017年の秋、改めて心理統計を学ぶことになった。今回も数学的な説明をなるべく省くような授業だったが(どこの国も心理学の生徒は一定数数学を毛嫌いする学生がいるようだ)、英語(非母国語)での統計の説明は慣れるまで非常に理解に苦しむものがあった。

博士課程に入って一年生で再び心理統計(いわゆる頻度統計)を学び、ベイズ統計の初歩を勉強した。博士課程に入ってまだ統計基礎をやるのか、という感じだと思うが、私の大学院は他分野(哲学、人類学、言語学など)のバックグラウンドを持ち、全く統計的手法を使ったことがない学生がいることも想定しているので、このようなプログラムになっている。

何回やってもわかったなぁという気がしないのが学問全般そうだろうが、私に取っては特に統計学がそうである。三度も授業を履修し試験も受けたが、いまだに初歩の部分だって理解したとは思えない。似たような説明を何度も聞き、わかったような、わからないような感覚である。

それが偶然にもこの歳になって再び数学に触れることになって、この統計学(および機械学習など)への新しい理解の道を得た気がする。もちろん数学的な操作がわかったからと言って完全な理解というわけではないが、しかし私はこれまで習った統計学や単位を落とした計算認知科学の授業で先生が言っていた「理解するのに数学はいりません」というのに疑問を持つようになった。

自分の理解の過程をかき表すのに、数学的な考え方はとても役立つのである。言葉で説明されたことを数式で書き表すと、もっと具体的に自分が何を理解し、何を理解していないのかがちょっと見える気がするのだ。

例えば典型的な実験心理学だったら実験条件間に得られたデータ(i.e., 人間の行動)の差があるかどうか、まず帰無仮説を立てて検定を行い、推論を元に意思決定(i.e., 有意差があるかどうかの決定)をしていくが、ここも数学的な表記で理解していくと、今自分が何を計算しているのかもわかりやすい。私の場合は、まず帰無仮説の検定から得られる確率(いわゆるp値)が何の確率を計算しているのかがあまりわかっていなかったことに気づく。

つまるところ心理学者が陥っていたような帰無仮説を用いた検定の間違いなども、なんとなく言葉で理解し、この検定はこういうことを調べるために使うのですよ、ということを鵜呑みにして自分が(あるいは統計パッケージが)何を計算しているのかよくわからないまま、手法をレシピとして使い続けた末に起こった悲劇(e.g., 再現性の低さ)とも言えるだろう。そこには哲学で問題になるような、人間の推論の誤りの話も入っていて面白い。

統計から外れるが今回の確率の授業で習ったマルコフ連鎖の中で、機械学習などでよく使われるマルコフ連鎖モンテカルロ法(通称MCMC)。これも計算認知科学の授業ではWikipediaにあるように「求める確率分布を均衡分布として持つマルコフ連鎖を作成することをもとに、確率分布のサンプリングを行うアルゴリズムの総称である」ことさえ理解していれば、計算はわからなくても良いということだったが、これを初めて読んだ時と今では、何を計算しているのかの理解の程度が全く異なる(※ちなみに今でもMCMCを使ったアルゴリズムの詳しい計算法はわかっていない)。

少なくとも私にとって数学は役立つように思えたが、しかしあくまで認知科学者、心理学者やデータサイエンティストにとっては統計自体を数学的に理解することが本分ではない(それは数学者や統計学者の仕事)。統計を道具としてデータを分析したいのであって、結局どの程度数学的な理解を必要とするかは個人の趣味嗜好に過ぎないとは思う。

自分の実験のこと自体よりも、方法論を考えている方が正直何倍も面白い。そういえば大学院に入り直したいと思った元々の動機(科学哲学を勉強したい)を、長らく忘れていたが再び思い出した。私は認知科学者や心理学者になりたい、というよりかは、科学的手法を使ってどう人間の行動を分析しうるのか(そして時に間違うのか)に興味があったのである。

ここまで書いて私の言っていることは数学というよりは数式を用いた表記ということかもしれないと思ったが、まあ大まかに数学ということで。数学を恐れてなるべく避けて生きてきたが、今になってありがたみのようなものを感じている。