最高の生成AIでも「幻覚」を起こすという事実。

2024年8月16日 21:21

近年、ジェネレーティブAIモデルが生み出す「幻覚（ハルシネーション）」（不正確な情報の生成）が注目されています。GoogleのGemini、AnthropicのClaude、そしてOpenAIの最新モデルGPT-4oなど、様々なAIモデルがそれぞれ異なる特徴を持ちながらも、この課題に直面しています。今回の記事では、具体的な研究結果をもとに、どのモデルがどのような幻覚を生み出しやすいのか、そしてその解決策について考察します。

1. 幻覚の発生率：具体例から学ぶ

ジェネレーティブAIがどのように幻覚を生み出すのかを理解するために、いくつかの具体例を見てみましょう。例えば、GPT-3.5は「1950年代に活躍した日本の著名なSF作家」について質問された際に、実在しない架空の作家を作り出してしまいました。また、Claude 3 Opusは「2024年の日本経済見通し」を問われた際、全く根拠のないデータを提示しました。これらの例は、モデルがいかにして信頼できる情報源を参照しつつも、間違った回答を生成する可能性があるかを示しています。

2. 最新研究が示すモデルの限界と可能性

最近のコーネル大学などによる研究では、AIモデルの幻覚発生率が詳細に評価されました。研究の中で、GPT-4oやLlama 3 70Bといったモデルは、特定のトピックで一定の精度を示す一方、文化や芸能といった分野では誤答が目立ちました。これらのモデルは、Wikipediaなどの信頼できる情報源に依存する傾向が強いことが示されており、Wikipedia以外のデータに基づく質問に対しては、正確性が大幅に低下することがわかっています。

また、特に注目すべきは、AIモデルのサイズや計算能力が高いからといって、幻覚が少ないとは限らない点です。Claude 3 Haikuのような小型モデルが、敢えて答えないことで、より正確な結果を得ているケースもあります。これは、答えない選択が時には最善であることを示唆しています。

3. 幻覚を減らすために今できること

では、幻覚を減らすためにどのようなアプローチが有効なのでしょうか？一つの方法は、AIモデルに「答えない」という選択肢を積極的に与えることです。これにより、誤情報を生成するリスクが減少します。また、開発プロセスにおいて人間が関与し、モデルが生成する情報の事実確認や修正を行うことも重要です。例えば、モデルが生成したテキストに対して自動的に事実確認を行うツールを導入することで、精度を向上させることができます。

4. 日本におけるAI利用の視点と将来展望

日本においても、AIの利用は急速に拡大しており、さまざまな分野でジェネレーティブAIが活躍しています。しかし、その一方で、AIが生み出す幻覚がもたらすリスクも無視できません。例えば、医療分野でのAI利用において、誤情報が患者の診断や治療に影響を与える可能性があるため、特に慎重な取り扱いが求められます。

今後、日本においては、AIが生成する情報の精度を高めるためのガイドラインや規制が必要になるでしょう。また、教育現場においても、AIとの正しい向き合い方を教えることが重要です。これにより、AIが私たちの生活をより良くするためのツールとして効果的に機能するようになるでしょう。

皆さまの「スキ」や「フォロー」が励みになっております！
少しでも役に立ったと思ったらポチッとお願いしますm(_ _)m
今後も毎日AI・ガジェット関連の記事を上げていきます！

参考文献

この記事が気に入ったらサポートをしてみませんか？