見出し画像

書くこと

「優れた数学者は紙とペンを使わない」という言葉をもらったのはもう1年前のことであるが、これをいまだにしばしば考える。

数学の本や論文は数式や記号をたくさん用いる。例えば、$${X}$$をある条件を満たす自然数の集合とすると、その後その論文ではその集合のことを「$${X}$$」という記号で表す。さらに、別のある条件を満たす自然数の集合を$${Y}$$とする。それから、$${X}$$の中に入っているものと$${Y}$$の中に入っているものが同じだったら

$$
X=Y
$$

と書いて、「エックスイコールワイ」と読む。

ここで、この「エックスイコールワイ」は発音されることを前提にした言葉ではなく、あくまで二つの集合が等しいことを表す記号である。こういった、音声・発音とは関係ない記号のような文書をsemasiography(セマシオグラフィー)と言う。コンピュータのプログラミングや音楽の楽譜もそうである。

それに対して、このnoteの文章のような、喋る時の音声と結びついた文書をglottography(グロトグラフィー)という。漢字やひらがなやアルフベットで書かれた文書は全てこっちである。これらの文書は声に読み上げて伝わるし、漢字やひらがなといった文字は、むしろ声に出す言語で何かを記録する機能がある。

さて、数学の文書はセマシオグラフィーが多用されるわけだが、「=(イコール)」のようなただの二本線が数学的記号として機能するのは、そこに人々の合意・共通了解があることを前提としている。「優れた数学者は紙とペンを使わない」の真意は、この共通了解にあるのではないだろうか。

例えば、数学の理論を新しく作り上げて、それを誰かに伝えようとしたら、新しい記号を定義してそれを使って書くことになる。なぜなら、全てグロトグラフィーで説明しようとするとその論文は大変に煩雑になるからだ。しかし、その数学の新しい理論を誰かに伝えるには、すなわちその理論に人々が共通了解するためには、必ずしも特定の記号を使用する必要はない。記号は便利だから使うだけだ。したがって、自分の頭の中にある数学の理論を目の前の人に伝えるにあたって、黒板やチョークに頼らず、自分の言葉で共通了解を生み出せる数学者は、その理論をしっかり理解している必要があり、優れた数学者に求められる能力と言えるかもしれない。

「書くこと」というテーマに戻る。noteも書き始めて3年以上がたった。それから、実はnoteとは別に、読者がいないことを前提とした日記を書いている。毎日は続かず、数ヶ月間書かないような時期もあるが、少し溜まってきたので分析してみることにした。

最近は自然言語処理というのがすごいらしく、自分の文章を分析するのもなかなか面白い。まず、noteの全ての文章(96記事)と日記(206日分)をいわゆるいわゆる人工知能に読ませた。この人工知能のモデルは日本語のWikipediaでトレーニングされていて、日本語の文書を近似的に相対化できる。それで、簡単な機械学習のアルゴリズムを使ってみると、見事に高い精度で僕の文章をnoteと日記に分類した。それから、クラスター解析と言って、それぞれの文書どうしの類似度で全ての文書をいくつかのかたまりに分けてみた結果が上の画像である。これは、ニュースの記事の内容がどのカテゴリーに入るかを自動で判別する時にも使われる解析で、どうやら僕の文章はいくつかの意味カテゴリーに分類されるようだ。

ここまでの解析は、数学専攻の独学でも大体できるくらいの基本的なことである。これをもっと詳しく分析しようと思ったらもう少し勉強する必要がありそうだ。しかしながら、こういったコンピュータを使った解析は人間が全て読んで分析するよりおもしろいことが分かるかもしれない。このように、まずデータがあって、それをとりあえず解析してみて何か結果を得るような研究をデータ駆動型の研究という。

僕は文書を書くことは自己管理の一面があると思っている。文書はデータである。自分のデータを記録しておいて自己管理に使うというのはよく人間がやることで、定期的に体重を測ったり、体調が悪くなれば熱を測ったりする。しかし最近はもっと色々なデータが収集されて分析される。それらを使ってデータ駆動型の自己管理をすることは面白いし、何かの力になるかもしれない。それもあって書くことを続けている。

サポートは金銭的・精神的に大きな支えになります。よろしくお願いします。