見出し画像

5年間ほとんど放置されていた情報戦兵器データ・ボイド脆弱性とはなにか? その1

ネットで検索を行った際、検索結果に陰謀論やプロパガンダが並んでしまう脆弱性=データボイド。先日紹介したnatureの論文ではこのために、情報をネット検索で確認すると、誤・偽情報を信じる確率が高まると指摘していた。複数の情報源を確認することではまる罠だ。下記の記事で概要を紹介したが、今回はデータボイド編その1としてデータボイドについて詳しく説明したい。その2ではケーススタディを紹介する予定だ。

ニュースの信憑性を調べるために検索すると偽情報を信じる可能性が高まる Nature論文
https://note.com/ichi_twnovel/n/n1a495ff32969

人はニュースよりも自分の事実確認能力を信頼している、という記事 ジャーナリズム不信とデータ・ボイド
https://note.com/ichi_twnovel/n/na023c6fdc4d5


●データボイドとはなにか?

データボイドとは文字通り、data の void、データの欠落を指す。検索した際に、対象となるサイトが全くなかったり、少数だった場合がデータボイドの状態だ。これがなぜ問題かというと、対象数が少ないと信憑性の低いサイトなどでも上位に表示されるようになる。検索した際に、データボイドが発生することを見越して、その検索対象になる言葉をちりばめたサイトを作っておけば上位に表示されるため、検索結果を操作しようとする相手には利用しやすい脆弱性となる。

さらに検索は検索エンジンだけで行われるのではなく、SNSの個々のプラットフォームでも行われる。一般の利用者はXやYouTubeの検索をニュース検索として利用するし、ジャーナリストも同様だ。したがって、社会への影響を考えると、YouTubeやSNSプラットフォームにおける検索のデータボイドも同じく深刻な問題となる。
同様にサジェストワードやレコメンデーションもデータボイドの影響を受ける。

データボイドの問題についてくわしく解説したレポートは下記である。

DATA VOIDS Where Missing Data Can Easily Be Exploited
https://datasociety.net/library/data-voids/

実はこのレポートは2019年10月に公開されたもので、データボイドの問題を最初に提起したものであり、事実上最後のレポートでもある。問題が指摘されてから5年近く経つわけだが、私の知る限りデータボイドについての調査研究はほとんど行われていない(少しはある)。問題の深刻さに比べて、実態把握、対策などが大幅に遅れているようだ。

●データボイドの5つのタイプ

このレポートでは最初に検索がどのように行われているかを解説し、データボイドとSEOは原理的に類似したものとしている。SEOが検索エンジンとのいたちごっこのようにデータボイドも同様で根絶することはできない。そのあとでデータボイドの問題に入っている。

1.ニュース速報

大きなニュースが速報で流れると、それを反映した検索が大量に発生する。しかし、その検索に対応したコンテンツがほとんどない場合も多く、ここにデータボイド脆弱性がある。2017年11月4日にテキサス州Sutherland Springsで銃の乱射事件が発生し、同時に地名での検索が大量に発生した。しかし、それまでSutherland Springsを検索する者はほとんどなく、ネット上のコンテンツもわずかだった。ウィキペディア、気象情報、地図などほとんどの地名を網羅している限られたサービスくらい。
大手メディアが報道する前にSNSなどで地名を含むコンテンツを発信することで、検索上位に表示されるようになり、合わせてSNSでジャーナリストに質問するトロールによってそれを強化した。
その操作に気づいたジャーナリストもいたが、入手出来る情報が限られているためANTIFAが犯人とする記事を掲載した。結果として、グーグルやBingで長らくこの記事の見出しが検索上位に表示され続けることとなってしまった。

2.戦略的新用語

新しい言葉を作ったり、過去に使われていてもあまり知られていなかった言葉を使うこともある。特定の用語に焦点を当てた手法だ。当然ながら、その用語を検索しても結果はほとんどないため、操作が可能となる。
その用語専用のサイトを作り、SNSでその用語を広めることで検索上位に用語が表示されるようになる。その用語や用語のサイトを問題視する言及もまたその用語の関心を呼び起こす役に立つ。

3.時代遅れの言葉

ほとんど使われなくなった言葉も利用できる。使われなくなっても言葉は検索エンジンに残る。ニュース速報や戦略的新用語と異なり、爆発的に検索されることはないものの、必要があって検索した際に陰謀論、プロパガンダ、差別といったコンテンツが上位に来るように操作できる。

4.言葉の組み合わせ

単語だけではなく、言葉の組み合わせでもデータボイドが生まれる。2018年の夏にバチカンで性的問題のスキャンダルが起きた際、「バチカンの性的虐待」と「バチカンの小児性愛者」と検索すると全く異なる結果が出ていた。
検索システムは、入力された検索を勝手に解釈して検索を行う。たとえば不法キャラバンを不法滞在者や違法外国人にまで拡大することもある。しかし、政治的な内容の場合、風当たりが強く監視されているため、できるだけ入力された言葉だけを対象にしている。そのためデータボイドができやすい。

5.問題のある検索

「ホロコーストはあったのか?」を正直に検索すると、「ホロコーストはあったのか?」あるいは類似のタイトル、見出しを持つ問題あるサイトが、以前は表示されていた。事実を記載したサイトのほとんどには、このような文言は使われていなかったためだ。同様の問題は、多数存在し、悪用可能となっている。

●レコメンデーションにも存在するデータボイド脆弱性

データボイド脆弱性は、レコメンデーションにも存在している。

1.検索バー

検索入力欄に現れる候補の言葉を推奨してくれるが、その言葉を操作するためにボットなどを使って特定の検索パターンを繰り返し行っていることがある。

2.YouTubeの自動再生

YouTubeにおいて次に再生する動画を選ぶアルゴリズムに介入することも可能となっている。

●非英語圏でのリスク

データボイドの性質上、非英語圏の方がより大きなリスクにさらされている。

●感想

前の記事でも書いたけど、日本はデータボイドのよいターゲットであることは間違いない。
日本の対外的な戦略的コミュニケーションにはデータボイドの観点が完全に欠落しており、それが戦略的コミュニケーションでボロ負けしている原因のひとつかもしれない。

民間企業に取っても脅威となる。なぜなら、特に中小企業の社名で検索されることは国内外でも少ない。データボイド脆弱性だらけなので、陰謀論やデマで陥れやすい。仮に自社あるいは親会社が株式公開しているなら簡単に株価に影響を与えられる。

関連記事

5年間ほとんど放置されていた情報戦兵器データ・ボイド脆弱性とはなにか? その1
https://editor.note.com/notes/nf5e0789e96e1/edit/

実態編 データ・ボイド脆弱性とはなにか? その2
https://note.com/ichi_twnovel/n/n3523739724f1

ニュースの信憑性を調べるために検索すると偽情報を信じる可能性が高まる Nature論文
https://note.com/ichi_twnovel/n/na023c6fdc4d5

人はニュースよりも自分の事実確認能力を信頼している、という記事 ジャーナリズム不信とデータ・ボイド
https://note.com/ichi_twnovel/n/na023c6fdc4d5

好評発売中!
ネット世論操作とデジタル影響工作:「見えざる手」を可視化する
『ウクライナ侵攻と情報戦』(扶桑社新書)
『フェイクニュース 戦略的戦争兵器』(角川新書)
『犯罪「事前」捜査』(角川新書)<政府機関が利用する民間企業製のスパイウェアについて解説。


本noteではサポートを受け付けております。よろしくお願いいたします。