見出し画像

数学点描vol.67 ミシェル・タラグランという偉大な数学者

数学には、大きな功績を残した数学者を表彰するノルウェー政府主催のアーベル賞という賞があります。
例えば、フェルマー予想を証明した著名な数学者アンドリュー・ワイルズ氏やゲーム理論でお馴染みのジョン・ナッシュ氏も受賞しています。

さて、2024年のアーベル賞を受賞したのはフランスの数学者ミシェル・タラグラン氏でした。彼は、統計学において非常に重要な業績を数々残しています。

最も面白い彼の功績の一つは「タラグランのL1-L2分散不等式」です。
正規分布という統計学でよく用いられている確率分布を考えてみましょう。
正規分布に従うデータX1,...,Xnによって計算される値f(X1,...,Xn)の散らばり具合(分散)
V[f(X1,…,Xn)]
がどうなるのかは興味深い問題で、統計学のあらゆる場面で議論になります。

この分散V[f(X1,…,Xn)]の厳密な値を知ることは一般に難しいので、
多くの場合は「高々いくら」という考え方をすることで、この分散の値を調べています。
この「高々いくら」という値を与える定理には「ポアンカレの不等式」が古くから知られていました。しかし、ポアンカレの不等式は経験的には粗い結果を与える不等式で好ましいものではありません。
そこで、登場したのがタラグランのL1-L2分散不等式でした。

タラグランは関数fの二種類の大きさ(L1ノルム・L2ノルム)を用いて分散V[f(X1,…,Xn)]が高々いくらなのかを与える不等式を作ることに成功しました。これがタラグランのL1-L2不等式です。
この不等式はポアンカレの不等式より鋭い結果を与えるため、現在の統計学や機械学習の理論解析でも重宝されています。

驚くべきは、この結果は「確率過程」を用いて導出されたということです。
確率過程は、一般には株の値動きなど時系列的なものをモデリングするときに使われる技術です。
この動的な数学的対象を用いて、静的な対象の結果を得る洞察力には驚きを隠せません。

タラグランのL1-L2不等式を用いて遊んでみましょう。
関数をf(X1,...,Xn)=max(X1,...,Xn)とすると、このL1-L2不等式は
正規分布から得られるデータの最大値の分散が
V[max(X1,…,Xn)] ≦ C/log(n)
を満たすことを教えてくれます。
データの数に対して、高々log(n)のオーダーで分散が小さくなるので、
最大値の分散を小さくするには結構なデータの数nが必要になる可能性が出てくるわけですね。

タラグラン氏はこの他にも「タラグランの集中不等式」という不等式を作りました。
これは統計的学習理論とよばれる機械学習の統計学的な解析を議論する教科書には必ず載っているほどで
こちらも機械学習の理論解析に欠かせない存在になっています。

知れば知るほどアーベル賞をとって然るべき方だと実感することができます。
そんなタラグラン氏ですが、受賞の報告を受けたときに
「I don't believe it.(中略)I'm sorry... I'm sorry...」
と言っていた姿がとても印象深く残っています。
https://www.youtube.com/watch?v=wDIqCN7E7VA

最後にタラグランはいくつかの未解決問題について個人的に懸賞金をかけています。
興味がある方はぜひ挑戦してみてください。
https://michel.talagrand.net/prizes/



この記事が気に入ったらサポートをしてみませんか?