見出し画像

AIにより生成された文章の見分け方(WIRED記事)

写真出展:Mohamed HassanによるPixabayからの画像https://pixabay.com/ja/users/mohamed_hassan-5229782/?utm_source=link-attribution&utm_medium=referral&utm_campaign=image&utm_content=4071274

 2023年2月8日にWIREDは、言語生成AIの文章作成能力とその見分け方に関する記事を発表した。内容は、ChatGPTなどの言語生成AI技術が進展するに伴い、AIにより生成された文章がインターネット上に拡散されつつあり、人間の書いたものと区別がつきにくくなっている現状、その見分け方についての現状を概観するものである。最近、言語生成AIが注目されているが、その利便性ばかりが注目され、危険性についてはほとんど報じられていないのが現状である。こういった技術に対する危険性を知らせるものとして、本記事の概要を紹介させていただく。

↓リンク先(How to Detect AI-Generated Text, According to Researchers)
https://www.wired.com/story/how-to-spot-generative-ai-text-chatgpt/

1.本記事の内容について
 ・ChatGPTのような言語生成AIが、日常生活において活用されつつある。学校では授業に活用され、企業でもヘルプデスクなどで活用されている。便利な側面がある一方、インターネットにはAIが生成した文章が氾濫するようにもなっている。バズフィードクイズのような害のないものであればよいが、プロパガンダ活動にも利用され始めており、研究者はAIが生成した文章をどのように見分ければよいかについて注目し始めている。
 ・言語生成AIを見抜くアルゴリズムの歴史は短く、2019年のハーバード大学、MIT、ワトソンAI研究室が発表した、人間のランダムさを基準とした実験的ツールがその先駆けである。人間の文章にはランダムな側面があり、要件をストレートに伝えるだけでなく、婉曲的な表現をしたり雑談のような文章を挟んだりすることもあり、このランダムさがあるか否かで見分けるのである。今年初めにプリンストン大学の学生が開発したGPTZeroというツールは、ランダムさや多様性に着目してAIが生成した文章を見分けるツールであり、教育者向けに用いられている。
 ・これらツールにより、AIが生成した文章はそれなりに見分けることができる。例えば、技術関係の記事を配信しているCNETでは、AIが生成した文章を記者が修正した記事を数多く公開しているが、言語生成AIの作成した文章には不自然な点が多々あることから、ツールにAIが生成した文章であると判定されないようにするためには、人間が欠点を補わなくてはならないのである。
 ・しかし今後は、こういったツールも役に立たなくなる可能性がある。ただ言語生成AIが完璧であるかというと、そうではない。言語生成AIは学習データに依存しており、データに含まれていない表現が活用されない傾向があることから、こういった表現に着目することで、AIと人間を区別することができるようになるという研究がある。
  また学習データにノイズを混ぜ、生成する文章を混乱させるという手法もある。ただこういったツールについて悲観的な見方もあり、最も確実な方法は大規模言語生成AIを作らないことであると主張されている。今後も新しいツールとAIのいたちごっこが続くものと思われるが、AIを利用しないことが最善の対策となり続けるだろう。

2.本記事読後の感想
  最近ChatGPTが話題となっており、インターネット上でも宣伝が多くみられるようになっている。これは単なるAIチャットボットに過ぎないわけだが、用途の広さが注目の理由なのだろう。言語学習や質疑応答が特に注目度が高いようで、小論文作成などの悪用事例も多々見られるようである。現在の所、完ぺきというわけではないため、見分けがつくようだが、今後の推移には注意が必要だろう。
  例えば、ロシアがハッキングのプログラミングやプロパガンダ活動に利用しているという事例もあるようで、単なる便利ツールの領域を超えた部分もあり、技術の進展によっては、安全保障上の最大級の脅威なりえると考えておく必要がある。
特にNAVERのように大規模言語生成モデルを作成している企業は、マーケティングだけでなく韓国のプロパガンダにも協力している節があり、こういった技術企業の話が出てきた場合には、経済だけでなくその技術の活用について常に留意しておく必要がある。無料だからと言って公開ツールを利用すれば、データを取られるだけでなく、個人の嗜好を把握されることでツールに依存させられるといったことも考えられる。
  技術は便利な反面、人を依存させてしまうという副作用もあり、適度な距離を維持しておく必要がある。今回のような記事は、技術の負の側面を適切に伝えるものであり、技術革新を相対化して見るために有用なものである。技術に関するニュースが出た場合には、良い側面だけでなく悪い側面にも着目する習慣を身に付けることが真の科学リテラシーである。

 英文を読んでわからないという方は、メールにて解説情報をご提供させていただきます。なにぶん素人の理解ですので、一部ご期待に沿えないかもしれませんので、その場合はご容赦願います。当方から提供した情報については、以下の条件を守ったうえで、ご利用いただきますようよろしくお願いいたします。

(1) 営利目的で利用しないこと。
(2) 個人の学習などの目的の範囲で利用し、集団での学習などで配布しないこと。
(3) 一部であっても不特定多数の者が閲覧可能な場所で掲載・公開する場合には、出典を明示すること。(リンク先及び提供者のサイト名)
(4) 著作元から著作権侵害という指摘があった場合、削除すること。
(5) 当方から提供した情報を用いて行う一切の行為(情報を編集・加工等した情報を利用することを含む。)について何ら責任を負わない。

この記事が気に入ったらサポートをしてみませんか?