見出し画像

WSMR-6: 新しいTwitter APIの概要、公開される

(朝起きたらTwitterのロゴの変化に驚いた方もいらっしゃるのではないでしょうか。公約が達成された模様です。)

ソーシャルメディアニュース

新しいTwitter APIの概要、公開される

Twitter社によるTwitter APIリニューアル宣言は多くの失望を買っていますが、その新しいAPIについて、公式のアナウンスにより新たな情報が判明しました。APIはいくつかのTierに分かれており、内容をざっとまとめると以下のようになりそうです。

1. 無料の場合は1,500 writes/月
2. 100ドル/月の場合は10,000 read/月、50,000 write/月
3. 旧無料APIアクセス(含Academic)は、今後30日間で廃止
4. Enterprise APIも公開予定だが、詳細は明かされず
5. 新しいAcademicアクセスが検討

雑感としては、依然としてTwitterのデータを利用した分析をする研究者やデータサイエンティストににとっては厳しい内容です。かりに、2点目の100ドル/月で10,000 read/月のアクセスでは、取得できるデータ量が少なく、分析には使うことはできないでしょう。また、”read”という文言がありますが、実際に10,000tweetを取れるわけではなく、これよりも少ないツイート数の取得しかできない模様です。Enterpriseに関しては、一節には42,000ドル/月と言われてましたが、公式には発表されませんでした

新しいAcademicアクセスは期待がよせられる一方で、実際にどうなるのかは不明というのもあり、すでに批判も寄せられています。 しかし、これまではAcademicアクセスは完全に抹消するという噂があったにも関わらず(実際に中の人のそういう発言を聞いたという研究者もいるようです)、「検討中」となったのは、社内でもまだAcademicアクセスの扱いに対する動きが流動的であることを示しているのかもしれません。Twitterのデータを利用した研究をおこなう研究者側も意見の表明などを通して、声をあげるべき時かもしれません。

Twitterの推薦アルゴリズム、公開される

Twitterの推薦によるタイムライン(for you)のアルゴリズムがオープンソース化されました。イーロン・マスク氏がCEO就任時から唱えられていたことが実行に移された形です。早速様々な議論がTwitterやGithub上で行われています。中でも顕著なのは、実際の推薦における影響が明示的に数値で示されたこと(Likeは30倍、RTは20倍など)。そして、コードの中に「アカウントがイーロン・マスクだった場合」という変数が見つかったことでしょうか。公開後にTwitter Spaceで行われた公開討論では、イーロン・マスクはこの変数の存在を知らず、開発チームは「あくまで統計を取得するための変数」という説明をしたそうです。このオープンソース化によってどう議論が展開していくかはまだ読めませんが、今後に注目です。

Twitterのアルゴリズム、誤情報と思わしきカテゴリのツイートの表示の順位を下げるようにするも、ウクライナ関連のツイートもそのカテゴリに含まれる

Twitterの表示アルゴリズムが公開し、様々な人が興味をもってコードを読んでいます。あるユーザーによると、Twitterの公開されたアルゴリズムでは誤情報(Misinformation)と思わしきトピックのツイートは優先して表示しない(down-ranked)実装がされているようです。しかし、その語情報トピックには、MedicalMisinfoのような医療情報に関する誤情報などが含まれていることが読み取れる中、UkraineCrisisTopic(ウクライナ危機関連)も含まれていたようです。もし、このタグがウクライナ戦争などにおけるツイート一般を指すタグだった場合、Twitterではこれらの情報が表示されにくくなっていた(いる)可能性があります。当然いえば当然ですが、何を見せて何を見せないかを操作できるプラットフォーマーの強大なフォース(力)を感じることができます。

https://twitter.com/aakashg0/status/1641976925064245249

世界各地でソーシャルメディアの利用に関するの因果効果関係を検証する国際共同研究が、ニューヨーク大学から呼びかけられるれました

ニューヨーク大学(NYU)の研究者が主導する世界規模のソーシャルメディアの利用に関する実験の共同研究者が募集されています。この実験では、参加者にFacebookアカウントの利用を約2週間停止してもらい、その様々なインパクト結果(分極化、集団間態度、幸福、信頼など)に与える影響を検証することが計画されています。この研究は様々な国と地域を対象として実施する予定で、ソーシャルメディア停止の因果的影響における異文化間の差異を検証することを目的としています。研究参加者はジャーナルに共著者として載る模様です。Twitterでも発起人のNYUの研究者による解説がされています。

スマホが健康に悪いかもしれないことに人々が気付き始める

今後、数年のインターネットと人間関連の研究で最もホットな研究トピックはスマホと健康、特に若者のメンタルヘルスとの関連研究かもしれません。様々なオピニオン・リーダーやメディアからスクリーンタイム(screen time)とメンタルヘルスの影響に関する意見が表明されています。一般的に、メンタルヘルスとスマホについて論じる場合TwitterやInstagramなど特定のサービスやサイトについて議論することが多くあります。しかし、最近のトレンドではそもそものスマホを見る時間(screen time)が幸福度の低下や孤立感を高めメンタルヘルスに悪影響なのではないかという議論がされています。日本では、20年以上前に「キレる17歳」といったブームがありましたが、このような世代論がスマホに関連づけて報じられている印象です。乱暴に言ってしまえば「スマホで病む若者」という具合でしょうか。実際、Z世代ではガラケー(dum-phone)をつかってスマホから距離を置こうとする謎ムーブメントもあるそうです。実際、スマートフォンの利用を制限することでメンタルヘルスが改善することは報告されているようです。

https://econ101.jp/honestly-its-probably-the-phones/
https://www.verywellmind.com/reducing-smartphone-use-can-improve-mental-health-5271918

C言語の標準規格の大改訂が今年に予定されている

誰も知らないでおなじみのC言語の標準規格ですが、本年に大改訂(major revisoin)が予定されています。予定されている改訂によってさらなるセキュアなコーディングが可能になるとのことです。C11 Standardから12の時を経てC23 Standardが登場することになります。

サム・アルトマンと社会主義的資本主義

OpenAIをリードする科学者として一躍ロックスターのように脚光を浴びているサム・アルトマン氏ですが、彼についてWall Street Journal(WSJ)が記事を出しています。当初、イーロン・マスクから支援を受けていたが現在は袂を分かっていることは日本のメディアでも報じられていますが、日本語メディアではその人となりは本人インタビューなどでしか伺い知ることはできません。WSJはアルトマン氏を、社会主義的な資本主義(social-minded capitalism)なリーダーと評する人もいれば、商業主義的思考とシリコンバレー式思考法に浸かりすぎている人(too commercially minded and immersed in Silicon Valley thinking)と評する人もいることを記事で述べています。また、すでにスタートアップ投資・売却で十分な資産を持ち、サンフランシスコにいくつもの家を所有していること、食料品をここ5年間は自分で買ったことが無いとも述べています。OpenAIは研究結果を社会に公開することで人類の発展に貢献することを目的としている非営利組織ですが、これはOpenAIが利益を追求しないことを意味しません。現在はOpenAIの利益の49%はマイクロソフト社が回収する契約になっており、残りの51%の利益の上限以上をOpenAIが利益にしないという方式が取られています。

気になった論文

ソーシャルメディアにおける中国の反欧米主義

中国共産党とその支持者は、中国のパブリックイメージを形成するために、ソーシャルメディアプラットフォームをますます活用しています。この研究では、このようなイメージ形成の中心となっているさまざまな形態の反欧米主義について、Redditのr/Sinoページを用いて分析しています。主流メディアとも比較し、これらのメディアが、台頭する中国と破綻する西側諸国との争いをどのようにフレームワーク化することで、国外の中国に対するネガティブな描写と競合する言説を作り出しているかに着目しています。結果としては、ソーシャルメディアにおける欧米に対する中国のイメージの積極的な強化と、中国の公式メディアや商業報道機関における同じトピックに関するより冷静な説明とを対比が示されたそうです。

https://journals.sagepub.com/doi/10.1177/20594364231166541

ソーシャルメディアにおける気候変動に関する過去10年間の画像を分析

画像は視覚を重視するソーシャルメディアのエコシステムにおいて、気候変動を伝えるための重要な手段となっています。本研究では、#climatechangeを含むツイートと一緒に表示される200万枚以上の画像と、それらの画像が引き出すエンゲージメントを分析しました。特に、頻繁に投稿される画像タイプ(例:テキストの視覚化)、ユーザーが好む画像タイプ(例:抗議画像)、ボットの影響やイベント開催に伴う周期的なコミュニケーションパターンなどの違いを明らかにしました。これらの知見は、気候変動コミュニケーションの文脈におけるニュースメディアロジックとソーシャルメディアロジックの区別や理解に役立ちます。

https://journals.sagepub.com/doi/10.1177/20563051231164310

ヒラリー・クリントンに関連するの女性嫌悪は、2016年米国選挙キャンペーンを通じて増加しました

オンライン上の女性差別では、女性政治家が特に被害にあっています。これは一部でバックラッシュ理論という、女性の政治的な台頭に対する脅威反応であると示唆されています。本研究では、この仮説をヒラリー・クリントンの大統領選挙キャンペーン前、中、後のTwitterでの言及を分析することで検証しました。2014年から2018年までのヒラリー・クリントンに言及した900万件以上のツイートのコーパスを収集し、コーパス内の女性差別的な言葉の相対頻度について中断時系列分析を採用しました。結果として、2015年以前はクリントンに関連するミソジニーのレベルは時間の経過とともに減少していにもかかわらず、彼女が大統領選挙を発表すると、この傾向は逆転しました。選挙期間中は、ミソジニーは着実に増加し、選挙成功の可能性が収まった選挙後に初めて増加が止まりました。これらの結果は、女性候補者に対するネット上のミソジニーは、女性候補者の政治的権力への野心による反発であるという考えと一致します。

メディア別に学習させた言語モデルで世論を予測することができる

最近は大規模言語モデルの話題が盛んですが、この研究は大規模言語モデルを使った世論予測の研究です。この研究では、オンラインニュース、テレビ放送、ラジオ番組のコンテンツに適応した言語モデルを提案し、一連のメディアを消費したサブ集団の意見を予測できるようにしました。特に、この手法はどのタイプの意見がメディア消費の影響を受けるかの判別を可能にし、メディアの影響を調査するための強力な新手法となりうることが示唆されています。

言語モデルは誰の意見を反映するのか?

大規模言語モデルは、インターネット中のデータを学習しているという意味で、世間の意見を反映しうるモデルだと言えそうです。この研究では実際に、言語モデル(LM)が反映する意見を調査するための定量的な枠組みを提示します。このフレームワークを用いて、中絶などの様々トピックについて、LMの意見と米国の様々なグループの意見との整合性を評価しました。その結果、現在のLMが反映する意見と米国の人口統計グループの意見との間に大きなズレがあることがわかりました。特に、このようなズレはLMを特定の人口集団に明示的に誘導した後でも持続していました。この分析は、人間のフィードバックによって調整されたLMが左寄りの傾向を持つという事前の観測を裏付けるだけでなく、現在のLMでは意見が十分に反映されないグループ(例えば、65歳以上や寡婦など)を浮き彫りにするものです。

ソーシャルボットの研究における誤解を解き明かす

ソーシャルボットは問題ですが、その解決策は(よく使われるツールはありますが)、定まったものはまだありません。この寄稿では、ソーシャルボットの研究における最近の結果を修正し、事実誤認や方法論的・概念的な問題を浮き彫りにし、修正します。結果として、厳密で偏りのない、責任ある方法でフェイクニュース研究を議論する必要性を表面化しています。

非白人科学者は、編集委員会に参加する回数が少なく、査読にかかる時間が長く、引用される回数が少ない

非白人科学者は様々な不平等が問題となっています。本研究では、過去20年間に6つの出版社から発表された100万件の論文を用いて、様々な格差を明らかにしました。これらの結果は、非白人科学者が不平等に苦しんでおり、学術キャリアが阻害される可能性を示しています。

https://www.pnas.org/doi/10.1073/pnas.2215324120

良いアイデアの空間的・時間的パターンの定量化

知識創造のプロセスを定量的に理解することは、科学の発展を加速させる上で重要です。近年、科学誌の出版データを研究することで、個人レベルおよび学問レベルで驚くべき発見が多くなされています。しかし、科学誌が大規模に登場し、研究成果を発表する主流になる前に、世界を変えた知的業績も存在しました。これらは現在、偉大な人々の偉大なアイデアとして言及されていますが、その誕生の一般的な法則はほとんど知られていません。

本論文では、Wikipediaや学術史書籍を参照し、9つの学問分野を網羅する2001の代表的な偉大なアイデアを収集、分析しました。その結果、偉大なアイデアの誕生が地理的に非常に集中しており、現代の知識生産などの他の人間活動よりも集中していることを示しています。また、空間・時間二部ネットワークの分析から、1870年代を中心とした大変革の存在を発見しました(これはアカデミアでの米国の台頭と関連している可能性があります)。最後に、反復的アプローチを用いて都市や歴史時代を再ランク付けし、都市のリーダーシップや歴史時代の繁栄を調査しました。

グラフニューラルネットワークを用いたネットワークレイアウトの高速化

ネットワーク可視化に用いられるグラフレイアウトアルゴリズムは、複雑なネットワークの内部構造や挙動を明らかにするための最初のツールであり、最も広く使用されているものです。現在のネットワーク可視化ソフトウェアは、力動レイアウト(FDL)アルゴリズムに依存していますが、これは計算複雑性が高く、大規模な実ネットワークの可視化は計算上不可能となっています。ここでは、グラフニューラルネットワーク(GNN)を用いてFDLを高速化し、ディープラーニングがFDLの両方の限界に対処できることを示します。実際、10〜100倍の速度向上と、より有益なレイアウトを得ることができたそうです。


この記事が気に入ったらサポートをしてみませんか?