見出し画像

私のAI君、ハルシネーションについて尋ねてみた

AIが誤情報を生成してしまうことがありますね。実際には存在しない、または正確でない情報を時々生成してしまいます。それをハルシネーション(幻覚)と言うのだそうです。

特に大規模言語モデル(LLM)において顕著に見られる現象なのだそうです。その話しです。お付き合いください。

私の場合

私の場合は、他の生成AIサービスに比べてGoogleGeminiでより頻繁にハルシネーションに出会います。ことに過去の歴史的な出来事についての情報を得ようとする時に顕著です。

理由をいろいろと推測してみるのですが、素人には分かるはずがありません。そこで、AI君に直接その原因を尋ね、説明してもらうことにしました。

Claude3.5Sonnetの回答です

比較的ハルシネーションが少ないと感じているClaudeに尋ねました。主な理由を 4つ上げてくれました。

1. トレーニングデータの限界:
AIモデルは与えられたデータセットから学習しますが、そのデータが不完全または偏っている可能性があります。
2. パターン認識の過剰適用:
AIは学習したパターンを新しい状況に適用しようとしますが、時として不適切な結果を生み出すことがあります。
3. コンテキストの誤解釈:
与えられた情報の文脈を正確に理解できず、誤った推論をすることがあります。
4. 確率的生成:
言語モデルは確率に基づいて次の単語を予測するため、時として意味の通らない文章を生成することがあります。

以上は一般的に考え得る理由ですね。なんとなく思い当たることがありますが、1.のトレーニングデータの限界と2.のパターン認識の過剰適用は密接な関連がありそうです。データの不足時にパターン認識が過剰に適用されて誤情報を生み出すことになるのでしょう。

3.はプロンプトの書き方によって起こりやすいことなのでしょう。4.について思い当たるのは、歴史的な出来事に関する時系列の混乱や、事物を修飾する語の錯誤という仕方で出会いっているのがそれだと思います。

Google Gemin の場合

さて、Geminに関して、ハルシネーションが起こる固有な理由があるなか尋ねてみました。こんな回答でした。

Geminiがより頻繁にハルシネーションを起こす可能性がある理由として、以下のような要因が考えられます:

1. トレーニングデータの特性:
   - 歴史的事実に関するデータの質や量が他のサービスと比べて不十分である可能性があります。
   - データセットに偏りがあり、特定の時代や地域の情報が不足している可能性があります。
2. モデルのアーキテクチャと規模:
   - Geminiのモデルアーキテクチャが歴史的事実の保持や検索に最適化されていない可能性があります。
   - モデルのサイズが比較対象の他のAIサービスよりも小さい可能性があります。
3. ファインチューニングの方針:
   - 歴史的事実の正確性よりも、他の側面(例:創造性や応答の多様性)に重点を置いてファインチューニングされている可能性があります。
4. 確信度の表現方法:
   - Geminiが不確実な情報をより積極的に提示する設計になっている可能性があります。これは必ずしも悪いことではありませんが、結果としてハルシネーションと認識されやすくなります。
5. 更新頻度と最新性:
   - 他のサービスと比べて、モデルの更新頻度が低い、あるいは更新方法が効果的でない可能性があります。
6. 出力の制御メカニズム:
   - 不確実な情報の出力を制限するメカニズムが、他のサービスほど厳格でない可能性があります。
7. マルチモーダル性能とのトレードオフ:
   - Geminiは画像認識などのマルチモーダルタスクも得意としていますが、これらの能力と歴史的事実の正確性との間でトレードオフが生じている可能性があります。
8. 評価指標の違い:
   - Google(Geminiの開発元)が採用している評価指標が、歴史的事実の正確性よりも他の側面を重視している可能性があります。

これらはあくまで推測であり、実際の原因はGoogleの開発チームのみが知り得るものです。また、AIの性能は常に進化しており、この状況は将来的に変わる可能性があります。

ユーザーとして重要なのは、どのAIサービスを使用する場合でも、特に歴史的事実のような重要な情報については、複数の信頼できる源で確認することです。AIの回答は便利な出発点として利用し、そこから更なる調査を行うことをお勧めします。

良し悪しは別にして、生成AIは各々個性的だということなのでしょう。複数の生成AIを使い続けていて、なんとなく個性を理解するようになっています。使い分けも重要ですね。

今回は、その個性を生み出す要因を8つ、教えてもらいました。頭に入れて、AI君の個性を弁えて、楽しくお付き合いを続けたいと思います。生成AIは楽しい遊び友だちです。
これからもよろしく!

ここまでです。お付き合いくださり有り難うございました。

この記事が気に入ったらサポートをしてみませんか?