生成AIで歴史的な変貌を遂げる科学論文 前例のない質と量の変化がもたらすもの
生成AIが論文の執筆によく使われるようになってきた。しかし、生成AIは不正確な情報を生成したり、偏見を助長するなどの問題を持っている。2010年から2024年までの1400万件以上のPubMed抄録の語彙の変化を調査した結果、生成AIによって人類史上未曾有の質と量の変化が起こっていることがわかった。
Delving into ChatGPT usage in academic writing through excess vocabulary、 https://doi.org/10.48550/arXiv.2406.07016
●概要
類似の調査研究は過去にもあったが、本論文は生成AIが使用する言語を体系的に調査した初めての研究らしい。この調査では生成AIが高い頻度で利用している280個のスタイルワード(動詞と形容詞)を発見した。
年間約150万件の論文がPubMed登録されており、生成AIはそのうち少なくとも10%、15万件の論文の執筆を支援していた。10%、15万件というのはあくまで下限であり、実際にももっと多い可能性が高い。
2024年に過剰に使用された単語が多数発見された。過剰使用が顕著なあまり一般的でない単語には、delves、showcasing、underscoresとその文法変化が含まれていた。過剰使用が顕著なより一般 的な単語には、potential、findings、crucialがあった。
COVID‐19パンデミック中にも過剰使用された言葉があったが、ほぼ全てが呼吸器系、レムデシビルなどの内容語(content words)だったのに対し、2024年に過剰使用された言葉は、280のうち、66%が動詞、18%が形容詞だった。それ以前に過剰使用された言葉のほとんどは名詞だったことから考えると急激かつ異様な変化と言える。
ChatGPTが利用可能になってから、280もの言葉の出現頻度が急激に増加し、以前の言葉の人気の変化でが名詞がほとんどだったのに対し、2023~24年の過剰な語句はスタイルワード(動詞と形容詞)だった。
生成AIの利用率は学術分野、所属国、ジャーナルによって5%未満から30%超までの範囲だった。たとえば、コンピュータ分野では使用率が高い(20%)。非英語圏の国でも利用率は高く、英語テキストの生成、編集に役立てている可能性がある。
生成AIは、トレーニングデータからバイアスやその他の欠陥を模倣する可能性があり、さらには完全に盗作する可能性もあ。また、生成AIの出力は、人間が書いたテキストよりも多様性と新規性が低くなるのがわかっている。このような均質化は、科学的な表現の質を低下させる可能性が指摘されている。たとえば、特定のトピックについて生成AIが生成する導入部はどれも同じようになる。
同じアイデアや参考文献のセットを引用することで革新性が失われ、引用が特定の論文に偏る傾向が強まる。さらに論文工場などの悪質な業者が生成AIの利用して量産を行う可能性がある。
生成AIの影響は質と量において前例のないものであることが、この論文を読むとよくわかる。
●感想
生成AI以前と以後で、科学そのものの概念が変わったんじゃないかと思う。
危惧されるのはツールとして使用しているうひに、ツールが生成するものに引きずられる可能性だ。それぞれの言葉には、異なる印象がついて回る。生成AIに要約させたり、リライトさせたりした時に現れる過剰使用される言葉は、言葉それ自体およびその組み合わせで指向性を持つ可能性がある。
グラフやチャート、統計解析で生成AIの支援を受けた時などがそうだ。これらは見せ方で印象が大きく変わる。生成AIが一定の指向性を持ってグラフやチャートを作り、データ解析を行うのだとすれば、その指向性は莫大な学習データの提供もとである欧米英語圏か、非人道的な強化学習に従事しているグローバル・サウスの英語圏の価値感や思想を反映したものになるだろう。あるいはネットに急増しているロシアや極右、陰謀論者のナラティブかもしれない。
いずれにしても、日本の価値感や思想が生成AIの指向性に反映される可能性がほとんどないのは悲しいというか、これからの世界での日本の立場を圧倒的に悪くしそうだ。
好評発売中!
『ネット世論操作とデジタル影響工作:「見えざる手」を可視化する』(原書房)
『ウクライナ侵攻と情報戦』(扶桑社新書)
『フェイクニュース 戦略的戦争兵器』(角川新書)
『犯罪「事前」捜査』(角川新書)<政府機関が利用する民間企業製のスパイウェアについて解説。
本noteではサポートを受け付けております。よろしくお願いいたします。