見出し画像

コンテキスト(文脈)の正体

 Google Home miniというスマートスピーカーを、割と早い時期に購入して以来、我が家にはスマートデバイスが増殖中である。

スマートスピーカー黎明期に、米国在住の方が「もしかして、スマートスピーカーは、私たちの家庭内の会話をすべて収集しているのではないか」という疑惑を持ったという話をどこかで読んだ。

誰にも話していないはずの、夫婦の間で「次の旅行は〇〇に行きたいね」という会話をしていただけの珍しい地名の場所の観光情報が、ブラウザのオススメに出てきたからだ。

さもありなん。

スマートスピーカーの音声は明示的に録音されているだけではなく、それ以外も情報収集されていたに違いない。Google Homeの履歴をみると、過去に私がスピーカーに放った言葉がテキストになって記録されている。どういう発声が、どういうテキストに変換されたのか、発声者である私には分かる。

音声データを抽出して、マシンが文字起こしをし、それを人間がチェックして一つ一つ訂正・更新して、そういう地道な学習をさせてAIは賢くなっていく。

必要なデータだと思うから、特に驚かない。アノニマスデータとして取り扱われる以上、私は別になんとも思わない。テクノロジーの進歩の方が楽しみすぎるのだ。

 このスマートスピーカーの挙動について想像を巡らせているうちに、「コンテキスト(文脈)」の正体とは、ある一定期間(場合によって異なる)における言葉の記録でしかないということに気づいた。何か書物を読んでいる時の文脈と同じで、その直前、またはそのちょっと前、もしくはその本の1ページ目からの話題によって文脈は限定され、規定されるということと大きくは変わらない。

ある日突然、その日に一度も発していない単語をカナメが話す。

「っていうかアレだよな。やっぱり高雄だよな。」

ここに他人の誰かが居合わせたら、この話の文脈は全くもって不明なのである。

が、私には、カナメとの間で数日前に話した旅行先の話だということが分かる。

もし、スマートスピーカーが私たちの会話をすべて記録していたとしたら、私ではなくても、彼(スマートスピーカー)にも「それが次回の旅行先の候補の話である」ということは分かるわけだ。

特に私がエスパーなわけでもない。夫婦間の以心伝心と思われることの多くは、多くの時間を共に過ごした際に交わされた会話の多くが脳内に蓄積されていて、その中の情報を総動員して、「この状況だとこの人はこういうことを言いそう(=思っていそう)」が推測できるだけの話なのである。

そこで私はある仮説を立てた。

ある一人の人間の発する言葉、記述する文章をすべて一つのデータベースに突っ込む。その膨大なデータから、ある質問に対して「その人が言いそうな言葉」というものをアウトプットすることは可能である。そして、そのアウトプットは、読んだ人が、その書き手がその人本人であると信じるに足るレベルである。

というものだ。

そのためには、人はできるだけ多くの自分の言葉を記録し、音声を記録し、行動を記録するようなことをして、データを集積しておくべきだとも思った。

そしたらさー。

個々人のデータではなく、多くの多数の人のあらゆる言語を収集して、それを基に(なんかすんごい賢い人たちが、マシンパワー全開で本気で)研究開発した結果、ChatGPTみたいなものが出て来るような時代になってたのよ!

人間の知能って、結局は、アウトプットされた言語でしかないってことなのかも!

脳の働きを研究することで、擬似知能ができると考える人もいただろうけれど、結局は「人間が発した言葉を集めて、色々とパラメーターを加えて整備していったら、あら不思議、人間の知能そのものみたいなもんができたやんけ!」というのが驚異の発見であったわけよ。

そうなってくると、子供の教育において、今後重要視されるべきものが何であるか、ちょっと見えたような気がした。

この記事が気に入ったらサポートをしてみませんか?