見出し画像

【知ると面白い】言葉のパターンを視覚化するワードクラウドの見えにくい凄さ【偏愛研究レポート】

この記事は、偏愛とマーケティング研究所のマガジン「偏愛研究レポート」に収録されています。毎週月曜に偏愛とマーケティング研究所メンバーの頭の中が更新されていくので、ぜひご覧ください。

どうも、最近は納富です。
今回は「ワードクラウド」と呼ばれるものについて詳しく書いていきます。

「ワードクラウドってなんぞや」って方もいると思うので、
簡単に説明しようと思うのですが、とりあえず大先生の説明を載せておきます。

文章で読んでも分かりにくい部分があると思うので、
おそらく画像を見てもらった方が早いです。

下の画像は『銀河鉄道の夜』をワードクラウドにしたやつです。

ユーザーローカル テキストマイニングツール( https://wordcloud.userlocal.jp/ )による分析

見たことありましたよね。これがワードクラウドです。

ワードクラウドでは頻出の単語が大きな文字で出力されます。
また一方で、小さい文字は大きい文字と比べるとそこまで出てこなかった単語です。このようにワードクラウドは直感的な理解にかなり優れています。

実際にこんな感じで、選挙の演説を分析する際にも使われたようです。

ちなみに、上の引用の記事の中には以下のような表現があり若干ややこしいのですが、ワードクラウドはAI分析ではない点に注意です。

ワードクラウドの凄さ

先ほど「ワードクラウドは直感的理解に優れている」という表現をしましたが、具体的にどのあたりが優れているのかを紹介していきます。

ワードクラウドの優れている点は、「誰でも理解できる」点です。
データ分析って正直、"どう見るか"が一番難しいんです。
分析(どちらかというと集計だが)自体でやることは、ただ平均を出したり中央値を出したり差や割合を見たりすることがほとんどです。

ただ、そこから何がわかるのかを発見するのが
データ分析の1番の難しいポイントです。
(僕もこの部分でいつも心折れそうになってます)

しかし、ワードクラウドに関しては誰が見ても結果がわかりやすいんです。
だからこそ、上記のNHKのサイトなんかにも使用されているわけです。

たった1枚の画像を見ることで、どのようなことを言っているのかある程度
理解できますからね。


ということで、僕が以前書いた以下の記事でもワードクラウドを生成してみました。

ユーザーローカル テキストマイニングツール( https://wordcloud.userlocal.jp/ )による分析

ワードクラウドで見ると改めて「偏愛」って単語を多用したんだろうなあ、、、と今更ながら思っています。。。

今回は、こちらの「大容量テキストマイニング」さんを使用させていただきましたが、実際にコードを書いて実行するのもそれほど難しくありません。

自分でコードを書いて実行してみるのもありなのかもしれませんね。

偏愛とマーケティング研究所について

偏愛とマーケティング研究所では、データの集め方、現場で活用できるデータ分析の方法を紹介しています。 「データを活用したいけど、何をしていいのか分からない」 なんて方はお気軽にご連絡ください。

著者: 納富 崇 / NOTOMI Takashi (X: @takashi_notomi)
偏愛とマーケティング研究所 代表 / データサイエンティスト

この記事が気に入ったらサポートをしてみませんか?