見出し画像

ハフポストに見るTwitterキュレーションの効果

謝辞部分のみ有料(購入ボーナスをちょっと付け加えました)。論旨は無料部分で読むことが出来ます。

概要

イーロン・マスク氏がTwitter社を買収する以前、同社はキュレーションと称して特定メディアのモーメント(ツイート)を優先的に表示していた。
独自の調査によりハフポストは、2020年7月から2022年10月までそのキュレーションにより通常より多くツイートが表示されていたと考えられる。
そのため、RTも推定(175RTのところを、978RTの拡散力を得ていたと考えられる)。
ツイートの優先表示にはTwitter運営による審査があった。その審査が、公正であったか?党派性がなかったかは検証されなければならない。
Twitterはトピックとして採用しなかったツイートの一覧を公開して欲しい。

ハフポスト拡散能力が落ちる

上記、Twitter社のキュレーションで、ハフポストは優先して表示されていた。それはそのツイートが獲得したRT(拡散力でもある)により推測できる。
まず、ハフポストの拡散能力を確認しよう。ハフポスト(https://twitter.com/HuffPostJapan の月別のRT数を集計した。
先行調査として、 幻集郎氏 のハフポスト日本版 @HuffPostJapan のツイート動向調査 (2022/10/20-11/12) 晴川雨読氏の ツイッターのニュース欄操作の影響をみる(追跡調査) などがある。

ハフポストジャパン、ツイート RT数推移

Twitterはキュレーションと称してメディアツイートの露出機会を上げる施策を行っていた。その施策は11月以降行われていないようだ。tweetのインプレション数は分からないが、RT数と連動していると推定できる。そのため、RT数を調査することで、インプレッション数を推測する。多くRTされているものはそれだけ、インプレッション数も獲得出来ていると考える。
ハフポストの月ごとのRT数推移を見る。RT数はそのツイートの情報拡散力を指し示す。小バズ(200RT - 500RT) 中バズ(500RT - 1500RT) 大バズ (1500RT以上)と定義して、そのツイート件数を調査した。

表にすると上記のようになる。
RT200から500は、9月22件10月11件11月4件 RT500から1500は9月14件10月8件11月3件 1500RT以上は4件8件0件となる。

他のマスコミRT数はどうか?

比較のためたのマスコミのRT数を集計する。
集計条件はハフポストと同様に、RT数区分で件数を集計した。

NHK https://twitter.com/nhk_news

NHK月次RT数推移

日経 https://twitter.com/nikkei

日経月次RT数推移

ハフポストは他のメディア(NHK,日経)と比較してもRT数の減少が激しい。

Twitterキュレーションの影響はどの程度あったのか?

イーロン・マスク氏が、Twitterを買収する以前、同社はキュレーションという仕組みを使って、報道機関のツイート露出を高めていた。
参考記事

それでは、キュレーションはいつから行われ、どのくらいの影響があったのだろうか?上記の記事はキュレーションの概要であるが、詳細は竹下記者のこの指摘でわかる。

つまり、自社記事のモーメントを作成して、キュレーションチームがそれを(人手で)選択してトピックとして表示していたというものだ。
私は、Twitterの中の人間ではないので詳細はわからない。しかし、外部に公開された情報から推測してみようと思う。
上記竹下記者の発言から次のことが推測できる

  • Topicとして表示されることでインプレッションが増える。それに連動してRT数も増える。

  • あるメディアの全てのツイートが下駄をはかされるわけではない。

  • あるメディアのツイートのうち、トピックとしてブーストしたものとしなかったものがある。

  • 掲載されたりされなかったりということは、一日1-2個くらい採用される。そのため、その社全体で月で100個を超えることはないだろう。

月のツイートのRT数を多い順番に並べれば通常は下記のようになる。ある特定のツイートがRTされるため、特定ツイートのRTが多くなるが、緩やかなカーブになる。

通常RTモデル

しかし、キュレーションにより下駄を履かされたツイートがある場合は、その分はRT数が通常より多くなることが想定されるため、以下のようなグラフになる。月次のRT数を多い順で並べた場合、ある順番まで、キュレーションの影響を受けたツイートが並ぶことになる。

キュレーション影響RTモデル

つまり、キュレーションの影響があるかどうかは、通常RTの比率Aと

通常RTのみの比率

キュレーション影響下でのRT 比率Bを比較すれば良いことになる。

キュレーション影響下RTが含まれる比率

それでは、キュレーションが行われていないと考えられるNHKの月次RT数を降順(多い順)に並べた、10番目/130番目の比率)を月ごとに求めた。そのグラフは下記のようになる。

NHK上位RT比率調査

NHK上位RT比率調査

ハフポスト上位RT比率調査

ハフポスト上位RT比率調査

NHK(キュレーションが行われてなかった)の場合、月ごとの10位のRT数と130位のRT数の比率を見ると、10倍を超えないものが大半だが、ハフポスト(キュレーションが行われた)の場合、2020年07月より20倍を超えるRT数比率になり、2022年10まで続く。キュレーションが終わった2022年11月は、10倍以下の7.5倍に落ち着く。

わかりにくいので具体的な数値で書く。

ハフポスト

2022年10月 10位 978RT 130位 23RT 比率 978/23=42
2022年11月 10位 143RT 130位 19RT 比率 143/19=7.5

ハフポスト2022年10月にもしキュレーションされてなければ、2022年11月の実績は7.5倍なので、推定拡散力は、978RTではなく、23*7.5=172.5RT程度では無かろうか?

NHK

2022年10月 上位10位 3462RT 上位130位 676RT 比率 3462/676 = 5.1
2022年11月 上位10位 3053RT 上位130位 522RT 比率 3053/522 =5.8

となる。NHKは5倍で安定しているが、ハフポストは、2020年7月以降、倍率が大きく変わる。

比較のため、他のメディアを調査する

日経

日経上位RT比率調査

産経

産経上位RT比率調査

SKISIRU
Twitterによるキュレーションが明らかになった際に、webメディア SAKISIRU 編集長の次のようなツイートが話題になった。

SAKISIRU編集長のつぶやき

それでは、SAKISIRUの上位RT比率はどうであろうか?

SAKISIRU上位RT比率調査

見たところ、ハフポストのように、比率が10倍を超えることはない。新田編集長が訴えたように、SAKISIRUはキュレーションの恩恵を受けていない。

Twitterによるキュレーションスタイルガイドでは 運用基準として、公平性 を上げているが、もし仮に左派とみなされるメディアはキュレーションで頻繁に取り上げ、右派とみなされるメディアは一つも取り上げてないのは、公平であったと言えるだろうか?
いわゆる右派とみなされるメディアとしてSAKISIRUを例に上げたが、所謂右派とみなされるメディアに詳しくないので他にあれば教えて欲しい(たのの右派メディアでキュレーションされたか調査したいので)。

公共財としてのTwitter

Twitterがキュレーションをやめたあと、毎日新聞は次のような記事を書いた。

マスク氏のツイッター 公共財の破壊につながる

ツイッターが公共財であるなら、左派(ハフポスト)のツイートはピックアップし、右派(SAKISIRU)のツイートはピックアップしないのは、公共財としてのツイッターを破壊していないだろうか?

内田樹氏は以下のようにツイートした。

一人の恣意で、公共財を破壊というが上記ハフポストの優遇は公共財の破壊ではないだろうか?
そしてハフポストの優遇は問題視せず、イーロン・マスク氏を批判するのは単なる党派性だとみなせる。
ロジックを徹底するには、どちらも良いかどちらも悪いしか無い。
自らの党派性に都合が良い場合には私企業の選択だと強弁し、都合が悪くなれば準公共だと言うならそれは単なるダブスタだろう。

類似例として、Twitter上のハッシュタグアクティビズムを調査した( Twitterの政治的ハッシュタグのトレンドの変化を調査した https://note.com/shioshio38/n/nf3273cf59ebd )。2022年9月まで、主に左派のハッシュタグアクティビズムがTwitterトレンドを占めていた。11月以降ハッシュタグアクティビズムが減った事を見て何らかの優遇が働いていたのではないか?という疑義があるが、Twitterが公共財ならマスコミはそれも問題視しなければならないがそれを問題視したマスコミを私は知らない。

Twitterは採用しなかったらモーメントを公開せよ

竹下記者の言うように、Twitterは人力の判断によりトピックに載せるメディアモーメントを決定していた。キュレーションスタイルガイドには、公平性を上げており、このTwitterjpへのインタビューでは、メディアのカラーをつけないと表現しているが、それではハフポストをトピックに大量に取り上げ、SAKISIRUを取り上げない行動と矛盾する。その行動は特定の党派を優遇したと見られても仕方がない。

上記竹下氏の証言では、ツイッター社のキュレーションは、

私たちメディアは自社記事のモーメントを作成→Twitterキュレーションチームに連絡→審査の上ピックされたりされなかったり

https://twitter.com/i_tkst/status/1589187616846798848

とある。つまり、審査の上採用されなかったモーメントがあるはずだ。
Twitter社は、審査の上、ピック(採用)しなかったモーメントを公開すべきだ。

Twitter社は、このインタビュー

キュレーションするツイートは、ジャーナリズムの原則である正確性や公平性を加味して選択する。取り上げる記事に関しては、記事の内容に偏りがないか、双方の主張が盛り込まれているかなども判断材料の一つだ。

https://xtrend.nikkei.com/atcl/contents/casestudy/00012/01032/

と主張しているが、そこには透明性は特に無い。ハフポストの日頃の報道を考えても、SAKISIRUに対して優遇する特別の理由はないように思える。
SAKISIRUの編集長が、モーメントを報告しても一つも載せられなかったと言ったがその差は単に党派性としか表現できないのではないか?

Twitter社は審査したが載せたかったモーメントとと載せたモーメントの一覧を公開すべきである。

キュレーションはメディアの地力を奪う

上記で見たように、Twitterのキュレーションは、公平性に問題がある可能性がある。どのニュースがトピックとして選択されるかはTwitter社内で決まり、公開もされずそのため事後検証もされない。それは、公平性に問題がある。

そして実際もう一つ問題があり、それはメディアの地力の拡散力を弱体化させる問題だ。下記グラフは、2017年1月からキュレーションが終了した2022年11月までのハフポストのRT数別の件数グラフだ。
青いバーが、RT200以上500未満、橙色がRT500以上1500未満緑色がRT1500以上だ。
キュレーションが終了した2022年11月は水色の四角で囲っているが、2017年以降最も拡散力が低い。
キュレーションでTwitterから下駄を履かされることに慣れすぎてメディアが持っている地力を失ってしまっているのではないか?

キュレーションはメディアの地力を奪うのでは?

(追記)2022年12月のハフポストのRT数推移

2022年12月はまだ終わっていないため、本文では触れていないが、2022年12月、ハフポストの拡散力は更に厳しくなっている。
12月18日時点でRT200以上が1件しか無いため、RT50以上を対象に集計した(ハフポストはだいたい72時間でRT数の伸びが止まるため15日までの数値と考えて差し支えない)。
RT 50以上100以下で 11月の1/3 RT200以上500以下で 1/4になっている。あれ程あった、RT1500以上どころかRT 500以上も0件である。
メディアの拡散力としては、極めて厳しいことになっている。
RT数や露出は狙っていない必要な人に届けば良いという反論もあるかもしれないがそれならハフポストがモーメントをつかって積極的にTwitterトピックに載せていた行動と整合性は取れない。

ハフポストジャパン 2022年12月状況
ハフポストジャパン 2022年12月状況

(FAQ) どうして10位と130位を選ぶのか?

上記、キュレーションの影響を調べるため、月間RT数、10位と130位を比較した。10位と130位を選んだ理由を説明する。
比を調べるなら1位でも良いが、上位のツイートには、キュレーション以外の影響として炎上やなんだかよくわからない理由でバズる事があるので、あまりに上位の場合はノイズがまじりやすい。そのため、ある程度それらの影響を受けない10位を選んだ。
130位は、上記竹下記者の一日数個Twitter運営にピックアップされるとの情報から 1日最大4個選ばれたと考えて、10+30*4=130位であれば、多分、キュレーションの影響を受けてないRTであろうとの推測から選択した。

(FAQ) データの集計方法

twitter データの収集は、ライブラリを使って行った。twitterデータの収集ライブラリは色々あるので、色々試して欲しい。
そのライブラリを使って、 @nhk_news や @HuffPostJapan @nikkei などのツイートを取得した。
それを、Jupyter-Notebook (https://jupyter.org/) を利用して集計した。
DataFrameとnumpyを使って集計をすると楽である。
バックエンドのmongodbを使うことが多い。

上記で全文ですがサーバ代を賄うため課金を付けた。課金しても良いという方はご購入をお願いしたい(購入ボーナスで、ハフポストがキュレーションの恩恵を受けたと気付いた契機について書いた。

謝辞

ここから先は有料部分です。

ここから先は

678字 / 3画像

¥ 500

この記事が気に入ったらサポートをしてみませんか?