機械学習・深層学習

機械学習・深層学習が大流行である。ファイナンス分野でもこれらの最新の技術を使って研究をしようということで、その手の論文を目にすることが増えてきた。それ以上に多いのはコンピューターサイエンスや統計学の専攻で機械学習を勉強したいという学生の数である。最近、リサーチ・アシスタントを募集したのだけど、プロジェクトのタイトルに「ファイナンスのデータ分析」という名前を付けたために、当初想定していたファイナンス専攻の学生よりも統計学の専攻の学生が多く応募してきた。なんにしても新しいことに興味を持つのは結構なことである。

それにしても、機械学習・深層学習はファイナンスを含む社会科学全般の発展に役立つのだろうか。なぜなら、社会学、特に経済学は人間の行動が引き起こす複雑怪奇な事象をわかりやすく、単純化した数式で把握することにこれまで重点を置いてきたからである。資産価格決定理論(CAPM)などがその最たる例だけど、とにかく単純であればあるほど美しく、深い洞察を得ることができると考えられている。逆に、100本以上の方程式を使った大規模なモデルで経済のあらゆる側面をとらえようとする試みには、少なくとも自分の大学院時代の指導教官たちは非常に懐疑的であった。仮に、100本の方程式で企業活動・家計行動・金融市場の全ての経済データにフィットできたとしても、結局方程式のどの変数を動かすとどこがどう反応するのか、モデルの使い手が完全に把握できないような複雑なモデルには価値がないという考え方である。

なぜ、シンプルさは大事なのか。それはよく地図に例えて説明される。画像データに基づくグーグル・アースと、昔ながらの道路と主要な建物だけが描かれた地図ではどちらがA地点からB地点に到達するのにより役立つか。もちろん、用途をAからBに行くと限定すれば、余計な情報が載っていない昔ながらの地図のほうがはるかに役に立つ。なので、モデルを「より現実らしく見せる」努力というのは、地図をグーグル・アースに置き換えるのと同様に無意味である。グーグル・アースは普通の地図よりはるかに現実に近く見えるけど、だからといって地図として役に立つわけではない。経済学者がモデルを作ろうとするのは良い地図を作ろうとするのに似ている、というわけだ。
機械学習・深層学習はそういったシンプルな定式化を希求する精神とは完全に逆を行っているように見える。画像診断などが最たる例であろうか。私たち人間は様々な画像を見て、自分にとって必要な部分を瞬時に判断し、人の顔や文字の形やらを選び出してすぐに解釈できる。一体どうしてそんなことができるのか。その理屈は分からないけど、それはそれとしてコンピューターに人間の脳と同じような判断ができるようになるまでしっかり「訓練」してやればやがて人間と同じような画像認識がコンピューターにも可能になるというのが機械学習・深層学習の用途(の一つ)である。もちろんこうした用途で機械学習が役立つという点には全く異論はない。いち消費者としてこうした技術が医療やら車の運転やらを大きく改善してくれるのは大歓迎である。

一方、ファイナンスを含む経済学の研究において、こういう「理屈は分からないけど、とにかくできちゃうんです」ということをもって学問の発展であると主張するのは難しい。例えば、過去の株価のデータに機械学習アルゴリズムを当てはめて、コンピューターがとても上手に将来の株価を予測できるようになったとする。そのような結果をまとめた論文はジャーナル・オブ・ファイナンスに掲載するのにふさわしいであろうか。

個人的にはこうした論文でファイナンスのトップの学術誌に論文を掲載するのは非常に難しいと考える。第一の理由は、先ほども述べたように論文では「なぜ株価が予測できるのか」という理屈が大事なのであって、過去のデータにうまくフィットするというのはあくまでもその理屈を支える一つの証拠としての役割しかないからである。この理屈がきちんと説明できないにデータにフィットしたからということで論文を書けると思う人は沢山いるようだが、こうした論文を「単なるデータ・マイニング」と呼んで忌み嫌う学者も多いのは経済学を学んだことのある人なら分かるだろう(この文脈では「データ・マイニング」という言葉は非常に悪い、侮蔑的な意味で使われる)。

第二の理由は、過去の株価のデータは、機械学習がまだ開発されていなかった期間を含むからである。つまり、アルゴリズムに基づいた取引がなされていない時期(たとえば1960年くらい)に、自分だけがアルゴリズムに基づいて取引できたと仮定して、2022年の時点で書いたコードに基づいて1960年にこう取引していれば利益が上げられていたはず、というのは説得力がない。なぜなら、2022年の時点に作られたアルゴリズムを実際に今使おうとすれば、同時期に作られた同じように優秀なアルゴリズムと競争してなおかつ予測力で上回って利益を上げる必要があるからである。1960年にはそんな競争はないわけだから、現時点のアルゴリズムを過去のデータに当てはめてうまくいくのはある意味当然と言える。

更に、仮に2022年の時点でこのアルゴリズムが機能するとしても、それを論文として発表してしまえば当然その仕組みは市場の参加者に明らかになるわけだから、当然それを真似しようとする人が出てくる。したがって、論文として発表したために、発表時点で事実であったことが発表後には事実ではなくなるということが想定できる。こういった論文は学術誌に載せる意味はあるのだろうか。

このような理由で、機械学習で株価を予測するという論文は星の数ほどあっても、良いファイナンスのジャーナルに乗るのはほんのわずかである。(ゼロではない)今後は変わっていくのか、それはまだ分からない。

この記事が気に入ったらサポートをしてみませんか?