見出し画像

AIの回答を鵜呑みにするな

MSのBing (ChatGPT)、GoogleのBardなど言語AIが世間の耳目を集めている。これらのAI体系環境システムは、回答結果を鵜呑みにすると、大変な間違いを犯すことになる。

Bing Chatの問答例

海洋哺乳類である 鯨の進化について調べていた。太古の昔に動物は海から陸に上がって、足で歩く動物になった。この動物の一部が、再び海に回帰して今の鯨やイルカになった。

上記を踏まえてBingに、海に回帰した生物で、再度陸に上がる進化をした生物がいるか質問した。回答には、海に回帰した鯨などの説明があり、次に「サメやエイも海に回帰した」と付け加えた。そして「回帰後に再度陸に上がる事は考えにくい」と結論づけた。

しかし、このサメやエイの海への回帰については、明らかに間違い。なので、これらが陸に上がったことがあるか、と質問し直したところ、サメやエイが陸に上がったと事は無いと回答した。 そこで、前述の説明と矛盾すると入力したら、「 申し訳ありませんが、この会話を続けることはできません。私はまだ学習中なので、ご理解とご協力をお願いします」と、会話を一方的に中断された。

別の件で、アフリカに長距離を走るのが得意な猿はいるか、と質問した。回答は、アフリカの猿についての説明に続いて、「アフリカには長距離を走るのが得意な猿はいない」であった。ヒヒは得意ではないのかと思い、まずヒヒの種類について質問した。回答は、ヒヒの種類を説明し、その中でゲラダヒヒは長距離を走るのが得意と解説した。

ヒヒは猿の仲間かと質問したら、そうだと答えた。ゲラダヒヒの長距離云々・・・は、前述の回答に矛盾すると入力したら、「 申し訳ありませんが、・・・」の決まり文句で、会話を一方的に中断された。

AIは禅問答みたないな学習のし過ぎを避けたいのだろう。

後に通常のGoogle検索で、アフリカで長距離を走るのが得意な猿は、パタスモンキーであると分かった。因みに、この猿何十キロも走り、最高速度は時速55キロにもなるらしい。

AIに話を戻すと、よく知らない分野で、会話の流れから整合性が判断できない場合、最初の質問の回答のみを鵜呑みにしてはいけない。AIはその機能上、まことしやかに間違った記述を出力する。言い方(能動/受動の態)を変えたり、個別の単語、あるいは包括した単語を使って、再度質問して確認する必要がある。

更に、一般的な会話では、目的は何ですかとか、xxxx に興味ありますかとか、何かと質問して来る。小中学生だと個人情報をつい入力する可能性が大きい。学校の授業や親の監督下以外では使わせるべきではない。高校生以上は、AIの性質や使い方の授業を設けて、AIが嘘をつくことを認識させ、偽情報に惑わされない様に、教育すべきである。

画像AIについて


画像AIについてもプロ並の絵が描けると話題になっている。しかし、これは悪く言えば、天才的パクリ絵師であり、よく言えば非常に感化触発され易い天才的絵師である。何れにしても、人が描いた絵を元にしている。人の画家や絵師イラストレータが、何十時間、或いは何日もキャンバスや画面に向き合い、心血を注いで創作した絵を、ちょちょっとした入力で、その特徴を抜き出して他の絵と合成して出力している。

これが遊びの内ならまだ良いが、販売して金銭を稼ごうなどとなると、原画の創作者達は堪らないだろう。また、著作権違反に触れるだろう。いずれ何らかの規制が敷かれるだろう。特に欧州は芸術作品の著作権には厳格に対処してくる。

画像AIについては、少し誤解があるように思える。画像AIが使っている画像処理技術は古くからあり、例えば対象物や背景の抜き取り、再合成出力、画質の各種加工手法、等々は数十年前から既にある技術だ。電脳コンピュータは対象物を数値に置き換えないと処理できない。逆に電脳は画像を扱うのが得意だと言える。何故なら、画像は数値の塊だからだ。

画像の最小単位はピクセルと言う点である。これには、XY軸の位置情報数値、赤緑青の三原色の数値、彩度や透明度などの数値がある。電脳は、これらの数値を扱うのが得意だ。それ故、顔認証、医療診断、農場診断、魚種の特定や養殖池の中の魚の数の算定とかに、画像AIが使われ発展した。

しかし、電脳発達史で最後まで、技術者や研究者が達成出来なかったのが言語処理だ。言葉は数値ではないので、電脳AIは扱えなかったのだ。ところが最近、言語の数値化に成功した。それを利用しているのが、世間を騒がしているChatGPT等の言語AIだ。実は画像AIも入力者の言葉を理解できるところがキモだ。画像そのものではない。

言語の数値化


言語AIは巨大で個人の私電脳パソコンではとても作れない。言葉の数値化で、理解している概念を比喩的に、説明すると以下の様になる。
まず単語に、既存の文書のなかで使われている頻度(数値)や単語間の距離(数値)(他の単語と関係が幾つ在るか等)から数値を割り振る。この作業は人が考える場合もある。例えば王様が1.0なら、女王は0.9、王子は0.8、王妃は0.5とか、継承順位から付けたりなどだ。

「画像」と「音」を例に取ると、それぞれ仮に、0.4と0.2だったとする。画像足す音として0.6が得られたとする(算数ではなくAND,ORの確率的検索の意味)。0.6を元に検索をすると、アニメや動画、映画が引っかかると言う寸法だ。しかし、アニメ引く画像とすると、音とxx数値が出たりする。このxx数値で検索すると、声優や俳優が出てくると言った感じだ。つまり、関連する言葉で連結網ネットワークが作られているのだ。尚、ここで言う検索は、通常の文書の文字検索とは全く違う。

さてここで、ある絵が在ったとする。その絵には専門家や素人の批評や感想文が、ネットに散らばっているはずだ。画像AI検索で、希望する絵について問い合わせ文書を入力する。すると既に数値化した語彙辞書を使い、どちらの文書(批評文、入力文)も数値化できる。つまり、問い合わせの文言に合う絵の文書が検索できる。複数の文言に対して、複数の文書を見つけ出し、それぞれの絵を色々合成して出力する、と言った具合だ。絵は膨大なAIの記憶部に、既に保管されている場合も在るだろう。
分からんことの方が多いので大雑把だが、こんな感じだ。

人は、人でないAIを人と感じる


今ChatGPT や画像AIに人々は驚いているが、これは人のある特性が原因だ。それは「人は人以外の物に人を感じる事ができる」能力だ。例えば顔絵文字(丸の中に目の点と口の曲線があるだけ)は単純なのに、笑い、泣き、怒りを人は読み取る。また、アニメや人形劇も同じだ。猿に猿のアニメや人形劇を見せても反応しない。

さて、AIは人類をどのように変えていくのだろうか。今のところ誰にも分からないが、これまでの石炭や石油の機械化学産業革命とは、根本的に異なる事が予想される。今までは物理的な衝撃だったが、今回のは精神的な衝撃となるだろう。IT革命の基盤である相互電網インターネットが登場した時、これを脳の神経網に例える考えがあった。

脳には神経細胞ニューロンが有り、神経と神経線根粒シナプスにより、網目のような複雑な神経網を形成している。人が何か学習しようとすると、神経細胞が興奮して信号があちこちの神経細胞に伝わる。学習が成立するころには、神経線が別の神経細胞に伸びたり、時には新しい神経細胞ができる。

相互電網も脳の神経網の様な動きを見せる。この場合、私電脳パソコンから閲覧具ブラウザを通してみる視聴情報コンテンツが在る場所、即ち接環与具(接待環境付与装具)サーバーが脳の神経細胞に当たる。接環与具は利用者による刺激、即ち電鼠押下マウスクリックが増えると、接待環境サービスや接環与具機器自体を増やす。これは脳の神経細胞で構成される神経網の活動に良く似ている。

相互電網インターネットは、数年前からカメラと言う目と、スマートスピーカーと言う耳と口を得ている。そして今、言語AIと言う言語領域と、完全ではないが画像AIと言う画像記憶領域を得た。人の脳には同様の機能を持つ部分や、感情を生む領域などが有る。これらの神経細胞が出す信号を前頭葉で統括して心が生まれる。それでは、相互電網の前頭葉は何処だろうか。

相互電網には前頭葉に当たる部分は、今のところ見当たらない。しかし、もし相互電網と利用者、即ち人が一体のものと考えると、人が相互電網の前頭葉と言えないだろうか。もしそうだとすると、世界を見るにつけ、この前頭葉、あかんでぇー、としか言いようがない代物しろものだ。相互電網の発達で、この前頭葉が良き方向に進化するのか、あるいは、あかん前頭葉に統合されて、相互電網も、あかんでぇーの代物になるかは、神のみぞ知る。

以上

この記事が気に入ったらサポートをしてみませんか?