見出し画像

生成AIが嘘をつく?ーその内部メカニズムと誤解を解き明かす

読解の労力:★★★★☆
推定される面白さ:★★★★☆

 例によってとある記事がバズっていたので、生成AIについての考察を述べる。
 「ChatGPTはすごい」という人と「ChatGPTは嘘をつくから使えない」という人がいるのはGPT3.5が流行った頃からよく言われていた。
 言うまでもなく、私はChatGPTや生成AIに対して非常に肯定的な立場であるが、なぜこのように反応が二分しているのかを考察したことがあったので書き連ねる。
 単なる考察であって答えというつもりはない。

 私は生成AIが身近な存在であった検索ツールと誤認されており、生成AIと検索ツールが得意なことが違うために生じた悲劇と理解している。その意味では、元記事にある”裁ちばさみで鼻毛を切るな”から重要な示唆を得ることもできるだろう。多分、犯人はアトムではなくGoogleだと思う。(1)
 国民性に帰着することもできるかもしれないが、上記の仮定が正しければパソコンを他のツールの利用に使用していなかった等も回答になるだろう。(2)そもそも、回答者の属性がプレイヤーとマネージャーで異なっている点も意識すべきだろう。(3)

嘘をつかない生成AIがあったとして、我々はそれを使う意味があるだろうか

検索は嘘をつかないか?

 生成AIと検索の違いを考えてみる。
 生成AIは嘘をついて、検索は嘘をつかない。が一旦の回答になるかもしれない。しかしながら、生成AIは嘘をつくとしても、検索は嘘をつかないのだろうか。
 ここで、「嘘をつく」は、入力者の意図とは異なる結果が出力されることと定義する。

検索が嘘をつくケース

 私の足りない脳を振り絞って2パターン考えた。

①検索方法が間違っているケース
 例)五里霧中を調べたいのに、ゴリ夢中と検索してしまった
 →スペースの入れ方、誤解を招く表現
②検索内容が間違っているケース
 例)五里霧中と検索したが、検索結果の記事が間違っていた
 →情報が古い、ソースが信頼できない、SEO対策されている

 上記のどちらも、検索が嘘をついているというよりは人間側の力量不足(ネットを上手く使いこなせていない)として処理されるのではないかと思う。加えて言うなら、嘘を見抜くことができる人がほとんどだと推察する。(4)

検索とは何か

 検索とは自分が断片的に知っていることを深く知るという側面が大きい。検索する際に、完全に未知の単語を入力することはできない。
 手書きパッドを用いて初見の漢字を検索することは可能だが、ある意味でそこが検索の限界ということになる。
 私が言いたいことは、知らない事象はそもそも検索できないことと、検索には検証可能性があることである。

 下記にイメージ図を示す。緑で囲まれた範囲が既知の部分であり、検索で調べることができる範囲もほぼ同じである。厳密にいえば、検索には緑の範囲を外に広げる役割があるだろう。

自分が知っていること≒検索できること

生成AIとは何か

抽象的な言語

 言語とはそもそも抽象的なものである。ラーメンと一口に言っても味噌ラーメン、醬油ラーメン、豚骨ラーメンなどがあり、同じ味噌ラーメンでも私が今食べている味噌ラーメンとあなたが思い浮かべている味噌ラーメンは異なっている。(5)
 すなわち、単語は必ずしも現実の物体そのものを意味しているのではなく、現実の物体を一定程度抽象化したものである。補足すると、我々が思考することができるのは言語が抽象的なものだからである。(6)
 抽象的な指示文を入力した場合、生成AIが入力者の意図とは異なる結果を出力する(嘘をつく)ことは容易に想定できるだろう。そして、それは言語の特性を理解していないために発生していることがほとんどだと推察する。

適切な抽象化

 make、have、letの英単語を抽象化することを考える。このとき、以下のように様々な抽象化が考えられる。

①英単語
②動詞
③動詞の原形
④使役動詞
⑤4文字以内の単語

 ”単に抽象化するだけ”であれば、どれも正解になるだろうが、適切に分類するのであれば④ということになるだろう。
 仮に、使役動詞だと理解できる人をAさん、英単語としか認識できない人をBさんとして話を進める。
 make、have、letのような性質を持つ英単語が欲しい場合、生成AIに対する指示と回答は以下のようになると考える。

 Aさん「使役動詞を教えて」
→生成AI「make、have、let、getなどがあります。」
 Bさん「英単語を教えて」
→生成AI「good、hello、appleなどがあります。」

 使役動詞は単なる例であるが、こういった場合にBさんのような人間が生成AIが使えない(嘘をついている)と主張しているのではないだろうか。
 Bさんは「make、have、letを抽象化して」、「make、have、letに共通する要素を教えて」という質問を一度挟んでから本題に入った方がよい。

生成AIにできて検索にできないこと

 生成AIは一度抽象化を挟むことで、”自分にとっては未知であるが、大規模言語データには含まれている情報”に到達することができる。
 下記にイメージ図を示す。緑で囲まれた範囲が既知の部分であり、青で囲まれた範囲が大規模言語データの部分である。緑と青で囲われた範囲を経由することで、青だけで囲われた未知の情報にアクセスすることができる。
 緑だけで囲われた範囲は人間にとっての専門性ということになる。(7)

 念のため言っておくが、緑で囲われた範囲がこんなに大きいわけもないし、青で囲まれた範囲がこんなに小さいわけもない。

自分が知っていること≠生成AIが出力する結果

生成AIと検索

 関数や写像の考えを用いると説明できそうなので試みる。

検索の場合

 検索という行為は、以下のように表記される。
関数:検索
入力(X):検索ワード
出力(Y):検索結果

 下記画像の赤色部分が人間の入力よって影響を受ける部分となる。

単射かどうかについて議論する意味を感じない

生成AIの場合

 生成AIで出力するという行為は、以下のように表記される。
関数:プロンプト
入力:プロンプト
出力:生成結果

 同様に下記画像の赤色部分が人間の入力によって影響を受ける部分となる。検索との違いはプロンプトが独立変数だけでなく関数まで定義することにある。
 優れたプロンプトの一形態として、”優秀な弁護士になりきって~”などがあるが、これは関数の形を指定するための入力である。
 今までは、関数の形を考慮する必要はなかった。しかし、生成AIでは人間が入力する際にどのような結果が欲しいかを逆算する必要がある。
 つまり、関数やその関数に対する独立変数を決定するものがプロンプトである。(8)

プロンプトは関数の形を定義する


まとめ

 まとめるのが面倒なのでGPT4.0にやってもらいました。

①生成AIと検索ツールの混同
 これは重要な点で、確かにAIと検索ツールは根本的に異なります。検索ツールはインターネット上の既存の情報を探し出すのに対して、生成AIは既存の知識から新しい情報を生成します。これは検索エンジンが「嘘をつかない」と感じる理由であるかもしれません。なぜなら、それらは既存の情報を単に再提示するだけだからです。

②言語の抽象性とユーザーの入力
 あなたの指摘は正確で、言語の抽象的な性質は生成AIがユーザーの意図を完全に理解するのを難しくしています。同じ単語やフレーズでも、異なる文脈では異なる意味を持つことがあります。

③抽象化の不適切な理解
 これは、生成AIが時として「嘘をつく」理由の一つとして理解できます。ユーザーが期待する回答の精度は、質問の具体性や明確さに大いに依存します。

③プロンプトの不適切な指定
 これも大切な観察で、ユーザーがどのようにAIに質問をするかが、AIが提供する情報の質に大きな影響を与えます。


有識者の見解

 生成AIの使い方についてなのか、記事に対しての評価なのかは不明。


(1)私の考えはガバガバ理論であることは間違いないが、何らかの示唆を与えることができると信じて執筆している
(2)日本人の経営者でプログラム触れる人はどれだけいるのか?
(3)ツールの得意分野で使うという発想は素晴らしいが、取り急ぎ使えそうなものに使うという発想はそこまで悪いものだろうか?
(4)まだ生成AIに習熟していないために嘘をつくと感じているだけかもしれない
(5)便宜的に”食べている”としたが、本当は食べていない
(6)この議論やこの記事については論理空間やオブジェクト指向の考えを流用することでより多くの示唆が得られるだろう
(7)例えば、自分の部屋の間取りなどが挙げられる
(8)個別具体的なプロンプトを覚えてもあまり意味がない。2,4,6,8,10…といった数字を全て覚えるのではなく、y=2nや偶数という概念を覚えた方が得策なのは明らかだろう


おまけ

 記事についての簡単なクイズを作成してもらいました。
 
Q
生成AIが出力する結果と、自分が知っていることの関係性についての正しい記述はどれですか?
a. 自分が知っていること≠生成AIが出力する結果
b. 自分が知っていること≒生成AIが出力する結果
c. 自分が知っていること>生成AIが出力する結果
d. 自分が知っていること<生成AIが出力する結果

A
a. 自分が知っていること≠生成AIが出力する結果

解説:生成AIの出力結果は、ユーザーが知っている情報と必ずしも一致しない。これは、AIの学習データとユーザーの知識体系が異なる可能性があるからです。


 関連するおススメの本です。人間は猿の完全上位互換ではなく、得手不得手があることが書かれています。
 人間の人間性についての洞察も得られるかもしれません。


この記事が気に入ったらサポートをしてみませんか?