見出し画像

抽象化するほど、脳とコンピュータの境界がわからなくなる。

実験して出た値を解析するのに、線形代数と統計学が必ず使われる。
値、つまり、実験結果を定量して数字で出すことが強く求められるようになってきたから、なおさらそう思うのかもしれない。
自分の専門だから、生物学の実験で出たデータを頭の中に思い浮かべている。
物理や工学など、他の分野の研究者の人からすれば、値じゃないデータってなんだよ、と思われるかもしれない。
でも一昔前まで、生物学のデータの多くは定性的だった。
数字じゃなくて、ある・ない、あるいは精々、小さい・大きい、少ない・多い、で表記されていた。
あるタンパク質の量(バンドの濃さ)が、サンプルAよりサンプルBのほうが多い、という記述で十分だったし、今でもある程度、通用する。
定量的なデータだと、タンパク質の量を測って何グラムです、と記述しなければいけない。
少なくとも、サンプルAよりサンプルBのほうが何倍多い、と書かなければいけない。

さて、定量的に数字を使ってデータを記述できるようになれば、数学的に処理してより正確にものが言える。
数学には様々な分野があって、そのための解析手段は無数といっていいほど存在していて、その中からケースに応じて適切な解析手段を選ばなければいけない。
とりわけ、たくさん並んだ数字を扱い、そこから何かしらの傾向を見出すには、行列と統計学が必ず使われる。

数学に弱すぎて記述が正確じゃないかもしれないのでそこは許してほしい。

ものすごく大雑把に理解したところによると、行列は表のことで、それを変形したり整理するための数学が線形代数だ。
エクセルの表では、横に品物や人、工程などの項目が並んでいて、縦には日付が並んでいる。
縦と横は逆でもいい。
こうして表せば、何月何日に使われた物品Aは何個です、のように2つの項目(日付と物品)を簡単にまとめられる。
数学的に、項目は次元と呼ばれる。
項目(次元)は2つに限らない。
1つでもいいし、3つでも4つでもいい。
2つ以上になって表に書きづらくなっても、数学的には同じ様に処理できる。

統計学は、たくさん並んだ数字から全体の傾向を抽出するための学問領域だ。
日本人男性の平均身長を求めたり、サイコロを振って出る目の確率を計算したり、選挙で当選確実を出したりする行為は、すべて統計学の範疇に入る。
日本人男性はたくさんいて、それぞれの身長はバラバラだ。
人数分だけ、身長の値がある。
それを集めてきて、解析する。
当選確率も、出口調査や過去の実績、一部の開票結果など、いろいろな情報(値)を集めて、推測する。

それで、その統計学に突っ込む値も、行列で表記される。
何が言いたいかというと、すべての現象世界の情報は、行列で表せられるんじゃないかということだ。
補足しておくと、ベクトルでもテンソルでもいい。
数字の連なりで表記されうる。
さらに付け加えると、文字配列を扱えば文章もベクトルになるから、数値だけじゃなくて何かの記号の連なりで表記できると考えてもいい。

流行りのディープラーニングだって、行列をいい具合に変形させて答えを出す。
デジタル画像はピクセルごとに、色の濃淡が値で示されて、全体で写真や絵のように見せている。
ディープラーニングを使って画像識別するときには、この濃淡の数値の連なりを入れてやればいい。
画像に限らずデジタルデータは数値の集まりだから、良いモデルを選び、適切に学習を行えば、原理的にはすべての情報を扱える。

脳の働きが、神経ネットワークの総体だとすれば、神経細胞の活性化の程度や、神経細胞同士のつながり、つまりは神経ネットワークを数値化してやれば、それも行列だ。
神経ネットワークは化学反応と電気信号の組み合わせからできている。
化学反応や電気信号は当然、数値の連なりとして扱える。
だから、脳が処理している情報も行列だと考えることもできる。

ここまで書いてきてなんだが、今日のnoteは一種の欺瞞だ。
複数ある情報をわかりやすく記述する方法として、行列やベクトル、テンソルが生まれた。
世界が時空から成り立っている以上、脳に入ってくる情報は複数の要素からなる。
だから脳が扱う情報を行列で書けるのは、定義を繰り返しているだけだ。

ただ、歴史や哲学、文学を知ると自分が知らなかったものの見方ができるのと同じ様に、ほんのちょっとだけ数学を勉強して行列の概念を覚えるだけで、世界が少しだけ違ったふうに見えるという話だ。

この記事が気に入ったらサポートをしてみませんか?