見出し画像

おしゃべりな 人工知能講座⑬

目次はこちら

■自然言語は難しいという話

天馬「昼飯も食べたことだし、ラストスパートに入るぞ」
猿田くん「マリリンがいないと眠くなりそうだな~」
天馬「うるさい!では、最後にやっかいな自然言語処理に進む。やっかいというのは、自然言語を追求していくと、どうしても哲学のような領域に入ってしまうからだ」
猿田くん「先生、その『自然言語』という言葉は、すごく不自然ですよ」
天馬「鋭いな。この自然言語という言葉は、C言語とかPythonみたいなプログラミング言語と区別するためにできた言葉だよ」

スライド28

伴くん「コンピューターによる言語処理なら、哲学ではなく工学の分野ではないでしょうか?」
天馬「いや、それほど単純な話でもない。最近は機械翻訳の精度が著しく向上しただろう。では、伴くん『吾輩は猫である』を英語にすると?
伴くん「I am a CAT ですね」
天馬「愛さん、I am a CAT を日本語にすると?」
愛さん「私は猫です、になりますね」
猿田くん「僕は猫だよ、あたしは猫なんだ、拙者は猫だぞ、でも間違いじゃないですよ」
天馬「その通りだ。英語と違って日本語には一人称にあたる言葉は、たくさんあるだろう。男女や年齢、立場によってそれぞれ使い分けるから、それぞれニュアンスが異なっている。どの言葉を当てはめるかは、翻訳家の力量に依存することになるな」

愛さん「そうですね。英語の小説を日本語に翻訳する時、主人公が『ボク』か『俺』で話すのでは、かなり主人公の印象が変わりますね」
天馬「だから小説の機械翻訳は難しいんだ。まあニュアンスを正確に伝えることは人間でも難しいから、この件は棚上げしておこう。しかし単純だと思われている『言葉の定義』だけでも大変なんだ」
伴くん「そうなんですか?言葉の意味なら辞書に書いてありますよ」
天馬「では聞くが、椅子とはどんなものかな?」
伴くん「え?椅子は座るための家具じゃないですか」
愛さん「折り畳み椅子なら家具じゃなくて、道具かしら」
猿田くん「木の切り株でも腰掛けられるから椅子になるよ。会社の花壇の枠にも、みんな腰掛けているから椅子代わりになってるな」
伴くん「う~ん、人が腰掛けられるものなら何でも椅子なのか」
天馬「では、ディープラーニングで椅子を画像認識させたいので、椅子の写真を集めてくれ、と言ったらできるかね」
愛さん「普通の家具の椅子なら、ググれば画像は簡単に集まるし、画像認識もできそうね。だけど木の切り株を椅子と認識させるのは無茶ですね。それに椅子の写真に見えても、実際の高さが2メートルあったら、すでに椅子ではなくてオブジェね」

伴くん「なるほど。椅子を定義するには形状だけでは無理があるのか。人は疲れたら、腰を掛けられるとこならどこにでも腰掛けてしまいますからね」
天馬「じゃなんで、人は椅子を見極められるのかね?」
伴くん「経験?ですか」
猿田くん「でもそれじゃあ、人工知能には教えられないよ」
天馬「そうなんだ。人工知能に『椅子の意味』を教えようとしても、言葉や画像だけでは無理がある。『腰掛ける』という行為ができないと、本当の意味は理解できないことになる」
愛さん「だから自然言語処理は難しい、と先生は最初におっしゃったのですね」
猿田くん「人が腰掛けることができる物体、じゃダメですか?」

スライド29

天馬「その場合、人の大きさや重さの情報と、腰掛けるという動作を定義するために、足や腰の関節の曲がる方向などの物理的特性情報が必要になってくるだろう。座ったらつぶれたりしないような材料の情報もだ」
愛さん「つまり前に話のあった『フレーム問題』に陥るのですね。世の中のすべての事象を記述することはできない、というジレンマ」
猿田くん「でも人間だって、世の中のすべての事象を知っているわけではないですよ」
天馬「もちろんそうだ。ただ座るという行為は、歩けるようになったら誰でも幼児のうちに経験するので、知識がなくても『常識』として理解できているだろう。だから『腰を掛けられるもの』は教えなくても判別できるんだ」
伴くん「それでは人工知能には『体』がないので、永遠に理解できないのですか?」
猿田くん「人型ロボットに人工知能を搭載すれば、人間のような経験もできるぞ」
愛さん「ロボットには疲れるみたいな感情がないから、自ら経験することはないわね」

スライド30

天馬「だんだん雑談になってきたから、ここでこの話は終わりにする。とにかく、『言葉の意味』を正確に定義することが、いかに難しいかがわかっただろう。言葉は人間の長い歴史の中から生まれてきたもので、その『身体性』に依存した言葉が非常に多い。例えば、『食べ物』の定義は、それこそ人が食べてみないと分からないことくらいは理解できるだろう。この図にあるような『恋』などは、それこそ人間にしかない個人的な感情だから、客観的な定義などできるはずもない」
猿田くん「ちょっと待ってください。それでは人工知能に、いや身体を持たないコンピューターに、言葉の意味を教えることができないと言ってるんですか?」
天馬「いやいや、そこまで言い切っていない。眼が見えず、耳も聴こえないヘレン・ケラーでも世界を認識できたのだから、できないことはないはずだ」
猿田くん「身体には他に触覚、味覚、嗅覚もある人間と、コンピューターを比較するのは、比喩としては変ですよ」

天馬「うるさい奴だな。IoTで多種多様なセンサーと接続できるコンピューターは、五感しかない人間とは桁違いの情報を入力可能だ。だからコンピューターに、もし意識が生まれたら、人間とはまったく異なる世界観で、世界を認識するはずだぞ。
とにかく人間は、世界に存在する、ありとあらゆるものに言葉を付与することで、世界を認識してきたといえる。この世界に対して言葉すなわち記号(シンボル)を割り当てることを『シンボル・グラウンディング』と呼んでいる。
別にモノと記号は1対1である必要はない。先ほどの例にあげたように、椅子という言葉は人の行為から定義されたことからもわかるだろう。言葉はコミュニケーションの道具として発達してきたと一般的に思われているが、そうでもないはずだ。言葉がなかったら、自分の頭の中で考えることすらできないだろう。『はじめに言葉ありき』だ。これは『ヨハネによる福音書』の冒頭部分にある言葉だ。人間は数千年も前から、このことに気がついていたんだ。おっと、つい教養が出てしまうな」

猿田くん「でも人間たちは、天に届くほどのバベルの塔を建設して神の怒りをかい、その言葉を乱されてしまう。おっとボクも教養が出てしまった」
天馬「旧約聖書の創成記だな。どうもこの創世記の記述にあるように、世界中にある言葉の起源はバビロン周辺だという学説がある。そもそも英語やフランス語、イタリア語などの言語は元が同じで、各地域での方言でしかなかった。だから語順や文法が近くて機械翻訳が簡単なんだ。それに比べて、日本語や韓国語などは・・・」
愛さん「天馬先生!また話がずれてます」

伴くん「なるほど。人間は言葉を発明することで、世界を認識しコミュニケーションを図り、飛躍的に進化を遂げたのですね」
天馬「そうだ。だから人工知能にも同じように、世界を記号化して世界を認識させようとしてきた。これを『記号主義による人工知能』といっている。しかし何度も言っているように、『座るとか』『食べる』のような『身体性』に関わる言葉の意味などは、どうしても人工知能に教えることが難しいんだ。これは『シンボル・グラウンディング問題』とよばれている」

愛さん「では、人工知能には人間と同じような世界を認識できないのですか?」
天馬「いや、この『記号主義による人工知能』とは違うアプローチもある。それがニューラルネットワークを用いた『コネクショニズムによる人工知能』だ。脳をモデルとして、シンボルを直接与えるのではなく、多数の事例を学習させることで『経験』させようというものだ」
愛さん「どうもイメージがわきませんね」

スライド31

天馬「ではこの図を見たまえ。脳はこのように階層構造となっている。人間が『意識』できるのは最上位のところで、下位の部分は無意識の領域だ。記号主義とは、この最上位の部分で人工知能を作ろうとしていると言える。コネクショニズムは、下位の無意識領域で人工知能を作ろうとしていることになる」
伴くん「それだと、実現したかどうか判断できますか?無意識の領域だから、記号で表現できないのではないでしょうか?」
天馬「相変わらず鋭いな。そこが弱点なんだ。学習済みニューラルネットワークのパラメータをいくら眺めても何もわからない。だが出力結果を見ると、それらしい解答となっている。コンピューターのハードウェアをいくら分解したところで、そこにインストールされているソフトウェアで、何ができるかわからないのと同じだな」

愛さん「あれ?自然言語処理の話から始まったはずですが、いつのまにか認知科学の領域になってますね」
天馬「ま~ガマンしたまえ。僕が・・・」
猿田・伴・愛「博学多才なんでしょ!」
天馬「え~と、ここまで話した内容は、あくまで自然言語処理の前振りであり前段だ。自然言語をコンピューターで処理することがいかに難しいかを、どうしても理解してもらいたくて話したんだ」

次は「コンピューターに言葉を教えるには」

この記事が気に入ったらサポートをしてみませんか?