見出し画像

SNS(Twitter)から人の内面が見抜ける!?

本日の日経新聞26面「SNSから内面見抜く」という記事が気になったので調べたメモ。


1、記事の内容

SNSから本人の知能指数(IQ)や精神状態、生活習慣をAIを使って見抜く実験に総務省傘下の情報通信研究機構が成功した、という内容で、「わずか140文字の投稿でプライバシーを明かしたと思っていない人にとっては驚きの事実だ」としています。

以下記事の概要です。

☑️これまでも研究者らが「開放性」「誠実性」「外向性」「協調性」「精神症傾向」(Big5というらしい)の解析に挑んできたが、大まかな傾向が分かるだけだった。
☑️今回は個人のより細かな特徴まで突き止めることができた。
☑️具体的な手法はTwitterを利用している239人に個性にまつわるアンケートに回答してもらい、それぞれのTwitterの投稿内容と付け合わせることでAIに学習させ、それをもとにTwitterの内容をもとに人々の内面をあぶり出す規則性を次々と発見した。
☑️過去の大統領選挙時のFacebookのいいねを民間企業が分析し個々人の傾向を推定していた事例や現在の中国の信用スコアなどの例を出し、AIの開発指針や情報の活用などが問われており、我々の行動次第でAIが助ける道具となるか、監視の道具となるか、が分かれると結んでいる。


2、情報通信研究機構のプレスリリースを読むと

気になったので、検索してみました。情報通信研究機構のホームページに、8月20日付で「SNSの情報からIQや外向性など幅広いパーソナリティの推定に成功」というプレスリリースが掲載されていました。

正直、文系脳にはちょっと難しいのですが(言い訳です)、プレスリリースの最後に補足資料があり、そこに「今回の実験と結果の詳細」がありました。

結論からいうと、面白い相関関係が見られる項目もありましたが、全体的には、そんなに大騒ぎするような成果だったのか個人的には疑問が残りました。当たり前なのでは?、という。。(すいません)

素人の私の主観による評価は置いておいて、どんな調査だったか簡単に。

すでに100以上のツイートをしている、239名(男性156名、女性83名、平均年齢22.4歳)のTwitterユーザーに参加してもらい、パーソナリティテストに答えてもらう。

各ユーザーのTwitter情報のうち、
1)ネットワーク情報(ツイート数、リプライ数、リツイート数など15種類)
2)時間情報(時間、曜日、月あたりのツイートやリプライ数の平均、分散など)
3)言語統計情報(ツイートの単語数の平均、分散、1文の文字数の平均、分散、ポジティブ語とネガティブ語の相対頻度など)
4)使用単語情報(ツイートで用いられた単語の出現ベクトル)

のそれぞれから、どれくらいのパーソナリティを推定できるか調べた。

で、4つの情報から推定できたパーソナリティ情報は以下のとおり。

1)ネットワーク情報から

共感性、自閉症傾向、外向性など社会性に関するパーソナリティを推定できる、としていて、

具体的には、
☑️「いいね」される頻度が高いと言語系IQが高いと推定され、外向性は低いと推定される
☑️ リプライする相手の数が多いと外向性や共感性が高いと推定され、自閉症傾向や統合失調症傾向は低いと推定される
2)時間情報から

被験者の多くが大学生ということで生活時間のパータンが似ており、有意な推定はなし
3)言語統計情報から

統合失調症傾向、うつ傾向、不安傾向などメンタルヘルスとIQに関する推定できる、としていて、

具体的には、
☑️ 1文の文字数のばらつきがあると、統合失調症傾向などが高いと推定される
☑️ ポジティブな意味の単語の頻度とネガティブな意味の単語の頻度も多くのパーソナリティの推定に寄与

2つ目は当たり前ですが、1つ目は機構も書いている通り、Twitterにおける文字数のばらつきがメンタルヘルスの状態を反映するのが興味深いですね。

4)使用単語情報から

メンタルヘルス及びIQとともに、知性と飲酒喫煙を推定できる、としていて、

具体的には
☑️飲酒では、飲む、歩く、時刻表という単語が相関が強い
☑️強迫神経症傾向では、時間、優先度という単語が相関性が強い


プレスリリースは最後に、

本研究はソーシャルネットワーキングサービス(SNS)の一つであるTwitterのユーザーから幅広いパーソナリティの指標を収集し、AIの学習技術により分析することで、Twitterの情報から個人のパーソナリティを幅広く推定できることを明らかにしました。
(中略)
同時に、個人のパーソナリティを正確に特定するための推定精度は得られないという手法の限界点も明らかにしました。

と結んでいます。


3、まとめ

いかがでしょう?

記事だけ見るとなんかすごいことまで分かっちゃうのか、と思いましたが、詳細を聞けば1つ1つは、だろうねぇ、という感じではなかったでしょうか?


とはいえ、AIの使われ方の一つではありますよね。

なんとなく経験則では分かるようなことも、大量の対象に対して、瞬時に抽出できる、かつ、複数の軸を掛け合わせることで狙う傾向の人物を確度高く抽出できてしまう、という。

それはそれで、人が一つづつやるのでは到底使い物にならないものを、有効なデータとでき、しかもほぼリアルタイムでとれる訳ですから、ターゲットを絞った広告や、国として犯罪防止(犯罪率が高い心理状態の人を見つける等)などにも使えるわけです。

「1984」で国民を監視するのは「テレスクリーン」でしたが、画面の監視をするのに大変な人数が必要だったと思います。しかし、AIなら実現できそうで、中国はこうした分析はものすごく進んでいるのかなぁ、と妄想してしまいました。

もちろん、国立の研修機関である機構では、この調査の目的を「メンタルヘルスの分析や個性に応じた働きかけへの応用に期待」としていて、広告や、ましてや国民監視なんて考えてはいない、ですけどね。



最後までお読みいただいてありがとうございました。

新聞記事のちょっとした深掘りでしたが、お役に立つところがあれば嬉しいです。

この記事が気に入ったらサポートをしてみませんか?