見出し画像

#おひさまになった経緯 を簡単に調査してみた

※ユーザーローカルAIテキストマイニングで調査(https://textmining.userlocal.jp/)

はしがき

タテノ先生のタグのおかげで、「おひさまになった経緯」が結構な数可視化されたので、できる範囲でかき集めてちょっくら調査してみました。

本文中でも繰り返し断っていますが、あくまで概要をまとめ上げ可視化しただけ、つまりできることは傾向やいち要素の尻尾を掴むに留まります。

が、そのまとめ上げたデータ元は皆様の経験談からくる有益な情報であることには変わりありません。
この結果をもとに、ファンの裾野を広げるための「ハマってもらう」「知ってもらう」仕掛けづくりをぜひ考えてみてください。発信もお忘れなく。

全員で勝ちにいきましょう。


※5/25 最終版更新しました。

※各解析の詳細は初版をご確認ください。


初版(5/19)_17日時点までのデータ

ワードクラウド

まずは挨拶がわりにワードクラウドから確認していきましょう。
が、その前に注意されたいのが、これではあくまで「ハマった経緯が語られる時にはこの単語がよく出てくるのね」しか分からないこと。

文脈も様々ですし、当然ながら相関的なものは一切不明です。結果の大観の把握(アイキャッチ)に留めておいてください。

スコア順
※スコア:文書の中でその単語がどれだけ特徴的か。出現回数が多いほどスコアが高くなる。
(「言う」や「思う」など、どの文書にもよく現れる単語についてはスコアが低めになる。)
出現頻度順
各単語の出現数ソートの一部(名詞・動詞)
各単語の出現数ソートの一部(形容詞・感動詞)
※気になって調べると、感動詞の「うお」はとあるファンの「うおおおお」という叫びでした。そういうの、好きです。

やはりと言うべきか、『日向坂で会いましょう』がスコアでは他を圧倒。けやき坂やひらがなが目立つことから、当時から応援しているファンも多いのかもしれません。

メンバーでは佐々木美玲さん(あえてみーぱんに統一しました)、齊藤京子さん、影山優佳さん、小坂菜緒さんが確認できます。

念のためここでも断っておきますが、この四名の名が特に挙がっているだけで、決して他のメンバーがハマるきっかけになっていないとかではありません。

共起

続いて共起です。共起とは、一文の中に単語のセットが同時に出現するという意味です。つまりこちらも文脈による影響を受けるので参考までに。

共起ネットワーク(一緒に出てくる単語を線で結んだもの)

ワードクラウドでも圧倒的だった『日向坂で会いましょう』が「ハマる」と直結しています。そして、それは「動画」「YouTube」「漁る」と繋がっている。これが意味するところ、聡明な皆様ならお分かりいただけるでしょう。

また、「ライブや曲を見聞きする」、「オードリーが好き」も「ハマる」と少なからず一緒に使われているようです。

余談ですが、齊藤京子ー惚れるは正直笑いました。
いやあ、分かるなあ。彼女には「惚れる」だよね。

2次元マップ

2次元マップの詳細は以下の通りです。

2次元マップは、文章中に単語の出現傾向を全体的に俯瞰するためのもので、「近くにある単語同士は同じ場所で出てくる傾向が強い」ということを意味しています(単語の出現傾向が似た単語ほど近く、似ていない単語ほど遠く配置)。

2次元マップ
※XY軸に意味はなし
※色分けは見やすくするため

共起でも言及した『日向坂で会いましょう』、「ライブや曲」、「オードリー」が「日向坂」と「知る」の近くにありますね。
もちろん文脈を精緻に読み解く必要があるものの、それらの距離感の近さがみてとれます。

ひなあいと「面白い」はもう少し近くてもいいかなと思いますが、これは元データと解析設定に色々要因がありそうです。要確認ですね。

係り受け解析

要するにこれも微妙な単語の違いによって変わりますね。「おもろい」「おもしろい」を「面白い」に統一したりしましたが、まだまだっぽいです。これは反省点。

日向坂で会いましょうとハマるはもう少し係り受けの関係性がありそうですが…。要確認します。
穏やかじゃないですが、これもひとつの結果ということで。青春の馬は修正ポイントです。


階層的クラスタリング

文章中での出現傾向が似た単語をまとまりとしてとらえられるよう樹形図で表したものです。グループは色分けして表示しています。

生物の進化に使われる樹形図と考え方は同じです。つまり、左側で繋がっているほど出現傾向が似ている(右側で繋がっているほど出現傾向が似ていない)ってことですね。

一訂版(5/21)_20日時点までのデータ

今回は以下の変更があります。

  • 5/18~5/20までのデータの追加

  • けやき坂46(ひらがなけやき)を意味しかつ文脈上変更しても問題ないと考えられるものを「けやき坂」に統一

  • グループ名及び番組名を固有名詞登録

ワードクラウド

微調整と固有名詞化したことにより『欅って、書けない?』が高スコアに。4、5位くらいですかね。ファンにもかなりの流動性がある世界だと思うので、当時から残ってくださっている方が少なくないことを意味するこの結果は個人的に嬉しいです。同時に日向坂で会いましょうもきっとそうなっていくんだろうなと。

単語の同義語化は人力の限界を感じました。多少のエラーは起こるかもしれませんが、解析時の設定で実行していきます。

スコア順
出現頻度順
各単語の出現数ソートの一部(名詞・動詞)
各単語の出現数ソートの一部(形容詞・感動詞)

共起

大きな変化としては『日向坂で会いましょう』と「動画」の共起がなくなったこと。固有名詞化か追加データか、何の影響かは断定しかねますが、それらが同時に登場しなくなったことが伺えます。

あとは全体的にすっきりしたというか、「ああ、そうだよな」って感じの共起になってきたので、アプローチすべきポイントが明確になってきそうな雰囲気です。

「曲ー聴く」「興味ー持つ」をうまく扱えないかなといったところ。これは改善点ですね。

共起ネットワーク

2次元マップ

とうとう「YouTube」が中央へ。ハマるを整理するにあたっては望ましい結果というか、やはりその存在の大きさは図り知れません。

それにしても"影山優佳"という存在は偉大ですね。共起の「詳しいー凄い」も実は彼女のサッカー知識に紐づくものでした。しかも「しんどい」時をその姿でもって救ってくれた存在として評されています。たまたまのタイミングとはいえ、それだけ質と量ともに維持し露出を続けたのはやはりすごいなあと。

2次元マップ

その他

その他は以下の通りです。最後にある階層的クラスタリングで「可愛い」と「面白い」が似た傾向にあるのが興味深いですね。ハマるときの感情はそのふたつが並走するのでしょう。日向坂(で会いましょう)にピッタリだと思います。

最終版(5/25)_20日時点までのデータ

今回は以下の変更があります。

  • グループ名を「〇〇坂46」に統一

  • 細かな同義語設定(「かわいい」「可愛い」「カワイイ」を「可愛い」に統一する等)

  • 感動詞を除外して解析

ワードクラウド

同義語設定の兼ね合いだと思われますが、形容詞のスコアが「面白い」>「可愛い」になったのはちょっと興味深いですね。

スコアが高い単語は、そのテキストを特徴づける単語であるといえます。

つまり、面白さや可愛さが「ハマる」の感情面でのフックになることが多そうです。新規層にこれらを体感してもらう(よう何かに誘導する)にはどうしたら良いかを思案・実行するのが、"ファンにできること"の焦点としていいんじゃないでしょうか。
日向坂、ないしひなあいだけにかかる形容詞ではないことは忘れてはいけませんが。

スコア順
出現頻度順
各単語の出現数ソートの一部
※感動詞は除外

共起

『日向坂で会いましょう』と「切り抜き」「動画」などとの共起が復活。解析設定の問題だったようです。それ以外に大きな変化はありません。

ライブとハマるの共起に関してのちょっとした考察はまた機会があれば書いてみようと思います。

共起ネットワーク

2次元マップ

ひなあいと面白いが遠いですね。この考察は係り受け解析で言及しています。

「近くにある単語同士は同じ場所で出てくる傾向が強い」ということを意味しています。

それ以外は綺麗な分布図になった気がします。

文脈判断は欠かせないものの、がな推しは面白い、ひなあいはきっかけと可愛いにそれぞれ近いのは考察ポイントかも。

2次元マップ

係り受け解析

ひなあいと面白いが2次元マップ上では遠く配置された理由ですが、それなりに係り受けされている一方、他の名詞ともよく組み合わさっているから、という可能性が高そうです。

ひなあいとハマるの係り受けがそこまで多くないのは十中八九「言う必要がないから」でしょう。「ハマった経緯は?」という設問には、ひなあいと言うだけで十分伝わりますからね。

そしてこのちゃんはとにかく可愛い。異論無しです。

階層的クラスタリング

オードリー、ひなあい、がな推しが同クラスタにある=似た使われ方をしているのが、「きっかけは大体これじゃね?」みたいな感覚的な部分と、ここまでの解析内容の裏付けになってくれていますね。

この記事が気に入ったらサポートをしてみませんか?