生成AIが32%の確率で陰謀論を語るのは、大手メディア88%がAIの学習にライセンスを与えていないためというNewsGuardの主張

以前の記事に書いたトップ10の生成AIモデルが32%の確率で陰謀論を回答する問題の原因をNewsGuardが解説した。

生成AIの構造的欠陥がもたらす誤・偽情報の拡散、 https://note.com/ichi_twnovel/n/n4307f007e323

‘Information Voids’ Cause AI Models to Spread Russian Disinformation、 https://www.newsguardrealitycheck.com/p/reality-check-commentary-information


●概要

NewsGuardによれば生成AIは大手メディアの88%からランセンスを締結していないためブロックされている。そのためデータボイド脆弱性が生じ、信憑性の低い情報源の情報を語るようになったのだという。なお、NewsGuard社はデータボイドではなく、インフォメーション・ボイドと呼んでいる。

5年間ほとんど放置されていた情報戦兵器データ・ボイド脆弱性とはなにか? その1、 https://note.com/ichi_twnovel/n/nf5e0789e96e1

ロシアの陰謀論について質問された時、陰謀論そのものやそれを信奉するサイトの情報を多く学習していたら、回答は自ずと陰謀論を擁護したものになる。
NewsGuardは、より多くの大手メディアが生成AIモデルに対してライセンスを提供するようになればこの問題は解消すると記事で解説している。

●感想

そんなことでは解消しない、と即座に考えた。なぜなら、すでに同様の問題が検索エンジンやSNSの検索で起きており、その問題はいまだに解決されていないからだ。データボイド脆弱性の怖さは大手メディアが取り上げていないような言葉を選んで使うなど、回避が極めて困難な手法を使うことにある。以前の記事で紹介した5年前のレポートにすでに5つの手法が紹介されている。これらの手法は検索向けのものだが、AI向けの手法も開発される/されているだろう。

また、この記事をNewsGuardが公開した狙いはあまりにも露骨だ。次の2つに他ならない。

・生成AIモデルに大手メディアがライセンスを供与しないのは、陰謀論を拡散する手助けをしていることになるというプレッシャーをかける。あるいは責任転嫁。

・NewsGuardは生成AI学習のための信頼できるサイロのデータベースを保有しており、これを生成AI学習用に使わせるPR。

好評発売中!
『ネット世論操作とデジタル影響工作:「見えざる手」を可視化する』(原書房)
『ウクライナ侵攻と情報戦』(扶桑社新書)
『フェイクニュース 戦略的戦争兵器』(角川新書)
『犯罪「事前」捜査』(角川新書)<政府機関が利用する民間企業製のスパイウェアについて解説。

本noteではサポートを受け付けております。よろしくお願いいたします。