フェイクニュースは正しいニュースよりも拡散が速い (論文紹介)

2023年3月25日 17:51

「フェイクニュース」は誰もが知っている社会問題の1つとなっています。このフェイクニュースを研究対象として分析し、フェイクニュース研究の重要な位置付けとなっている、Science紙に2018年に採択された"The spread of true and false news online."という論文を今回紹介したいとおもいます。
この論文は、誤ったニュースは、正しいニュースと比較して、どのように拡散しているのだろうか？という問いに答えるために、2006年から2017年における正しいニュースと誤ったニュースの拡散傾向を比較することでこの問題について取り組んだものです。

事実確認されるカスケードの傾向

対象のデータは大規模なもので、ファクトチェックされた126,000件のカスケードデータ(450万回以上の拡散)が含まれたものです。一般的に、投稿のカスケードはリツイートされることによって、深さ、サイズ、幅、バイラリティどれもが増加する傾向にあります(図1A）。拡散の回数という観点で、正しいニュースと誤ったニュースで比較したところ、誤ったニュースは1000回以下の拡散が多い一方で、正しいニュースは1000回以上の拡散が多いという傾向がわかります（図1B）。誤ったニュースの出現と時期の関係を見てみると、アップルとサムスンの特許問題(2014年)や米国大統領選挙に対応する時期 (2016年末)などに強く相関しているそうです(図1C)。また、各カスケードのトピックを見てみると、大統領選挙の影響もあり政治関連のカスケードが最も多くなっているようです（図1F）。

誤ったニュースの拡散は速い

誤ったニュースと正しいニュースの拡散の傾向を比較してみると、何がわかるだろうか？結論から言うと、誤ったニュースは正しいニュースよりも、遠く、速く、深く、広く拡散されることがあきらかになりました。図2のAからDは誤ったニュース（赤）と正しいニュース（青）のカスケード構造を比較した相補累積分布となっています。例えば、上位0.01%の誤ったニュースが正しいニュースよりも8ホップ深く拡散し(図2A)、上位1%の誤ったニュースは1000人以上に拡散されることがわかります（図2B）。また、図2のEとFは時間的観点、GとHはカスケードの深さとユーザの関係について表した結果です。正しいニュースが1500人に届くまでに、誤ったニュースの6倍時間がかかることなどがわかります（図2F）。これらの結果から誤ったニュースが正しいニュースよりも拡散される傾向が強いことがわかるのです。

誤ったニュースを拡散するユーザの傾向は？

上記の結果を踏まえると、誤ったニュースの拡散に関わるユーザは「フォロワーが多く」、「認証されたユーザ」で、「長くTwitterを続けている」ユーザであると予想できるます。しかしながら、実際の傾向はこの予想とは異なる結果となります。ユーザ情報の統計的有意差を検証した結果（図3A）、誤ったニュースを拡散したユーザはフォローフォロワー数が少なく、認証やツイート数も少ないという想像と逆の結果になったのです。また、ロジスティック回帰モデルによって、投稿者の年齢、フォロワー数、フォロー数などの各変数を制御してみても誤ったニュースは真実のニュースよりも70%多く拡散されることが示されました(図3B)。このことから、ユーザの特性やネットワーク構造ではニュースの拡散の違いを説明できないことがわかります。

情報の「新しさ」が拡散を引き起こす

では、どのような要素が誤ったニュースの拡散を引き起こすのだろうか？ある研究では、新規性の高い情報が社会的にも、情報理論的にも価値が高いことが示されています。このことは誤ったニュースの拡散にも当てはまりそうです。彼らはトピックモデルの一種であるLatent Dirichlet Allocation Topic modelを用いて、ニュースの新規性について測定しました。やり方は、200トピック数で学習したトピックモデルを用いて、該当ニュースの投稿のトピック分布と、拡散する60日前の間にユーザが接触した投稿のトピック分布を比較して、本当のニュースと誤ったニュースに違いがあるのかを検証しました。その結果、information uniqueness、KL距離、Bhattacharyya距離の3つの指標で誤ったニュースが正しいニュースよりも優位に新規性が高いことがわかったのです (図3C/E)。ニュースの新規性の高さに対して、投稿の感情分析を行ったところ、ユーザは誤ったニュースに対して驚きと嫌悪の感情を強く表現して反応しているそうです(図3D/F)。

誤ったニュースを拡散してるのは私達である

誤ったニュースを拡散に寄与している存在として、Botなどのアルゴリズムの可能性も考えられます。そこで、彼らはBotの影響を削除するためにBot検出アルゴリズムを用いて、Botの効果を除去し、同様の分析を行いましたが、結果としては、Botがあった時もなかった時でも分析結果に違いをもたらしませんでした。どうも、誤ったニュースを拡散に寄与しているのはBotなんかではなく、私達みたいなのです。

この研究は、増え続ける誤ったニュースに対して、大規模データを用いた分析によって、どのように広がるのかについて科学的根拠をもたらした研究です。この分析によって誤ったニュースは新規性が高く、本当のニュースよりも拡散されやすい可能性を示唆するものとなっています。当然、私達の誤ったニュース（フェイクニュース）に対する理解やメディア・リテラシーの向上などによって、状況は変わっていくものかもしれません。しかしながら、このような研究に基づいて誤ったニュースの対策がとられていくことからも、重要な1本となっています。

余談：「フェイクニュース」という用語の扱い

ところで、私達は間違ったニュースのことを「フェイクニュース」と呼ぶことが多いですが、この研究では「フェイクニュース」と呼ぶことを明示的に避けています。彼らはフェイクニュースについて、このように述べています。"Although, at one time, it may have been appropriate to think of fake news as referring to the veracity of a news story, we now believe that this phrase has been irredeemably polarized in our current political and media climate."　つまり、フェイクニュースという用語は様々なところに使われ過ぎて、偏ってしまったのです。このような言葉は学術的な分野において用いることは適切ではありません。そういったことから、この研究ではニュースを「true」もしくは「false」という用語を用いて明確に区別しています。この流れは学術的分野だけでなく、イギリス政府などもこのことを懸念しており、公式な文書の中に「フェイクニュース」という用語を用いないことを決定しています。

Vosoughi, Soroush, Deb Roy, and Sinan Aral. "The spread of true and false news online." science 359.6380 (2018): 1146-1151.
https://www.science.org/doi/full/10.1126/science.aap9559

この記事が気に入ったらサポートをしてみませんか？