見出し画像

バッハ会長のスピーチを分析してみた

ご無沙汰しております!
データアナリストのkatooです。

昨年コロナ禍に突入してからリモートワークで引きこもるようになり創作意欲が低下してしまい全然更新できていませんでしたが、ようやく創作意欲が戻ってきたのでこれから徐々に更新頻度を上げていければと思っております。

ではさっそく本題ですが、久々に紹介する今回の内容は形態素解析という手法を使って「バッハ会長のスピーチを分析してみた」です。

そもそもなぜこの分析をやろうと思ったかというと、私はデータアナリストと言いながらもまだ形態素解析の分野に着手したことがなく今後のキャリアも考えてそろそろ着手しておかないとなと思い、せっかくやってみるなら先日行われた東京オリンピック2020開会式でスピーチが長いと話題になっていたバッハ会長のスピーチを分析してみようと思い実施しました。

そして今回の分析で期待している結果はスピーチが長いと批判されていたバッハ会長のスピーチにも熱く伝えたいメッセージがあったのではないかということです。

バッハ会長のスピーチの全文は下記サイトから取得しました。
https://www3.nhk.or.jp/news/html/20210724/k10013156341000.html

ちなみに橋本聖子会長のスピーチも掲載されていたので今回はそちらも分析してみました。

分析方法ですが、今回はWordCloudという単語の出現回数をカウントして可視化するシンプルな方法になります。では早速結果を見てみましょう!

バッハ会長のスピーチ分析結果

バッハ

上記のような結果になりました。
文字が大きく表示されているほどよく使われた単語になります。
「皆さま」と「オリンピック」がよく使われたみたいです。
その次が「東京」「日本」「大会」「アスリート」「コミュニティ」。
その次が「天皇陛下」「難民」「地域」「社会」「世界」などです。
ただ「皆さま」と「オリンピック」以外は色々な単語が同程度使われておりそこまで特徴がない印象です。

この結果から解釈するに、今回のバッハ会長の長いと批判されたスピーチは熱く伝えたいメッセージがあったというよりは、本当にまとまりがなく長くなってしまったという印象です。(※日本語訳を分析しているので英文を分析すると違う傾向が見えてくる可能性はあります)

以上のようにバッハ会長のスピーチの分析結果からはメッセージの傾向はみられませんでしたが、単純に出現回数をカウントするWordCloudによる分析方法に問題があるかもしれないので、次に橋本聖子会長のスピーチも同様に分析してみます。

橋本聖子会長のスピーチ分析結果

画像2

先ほどのバッハ会長の結果と比べると大きく表示されている単語とそうでない単語に極端に差があります。また「皆さま」や「オリンピック」に直接関連がある単語を除くと「世界」「世界中」という単語がよく使われているのが分かります。スピーチの原文の最後のほうを見ると「今こそ、アスリートとスポーツの力をお見せするときです。その力こそが、人々に再び希望を取り戻し、世界を一つにすることができると信じています。世界は皆さんを待っています。」とおっしゃっており、オリンピックを通じて世界を一つにしたいというメッセージ性があったスピーチだったんだなということが想像できます。

ということで今回の分析で分かったことは、単語の出現回数をカウントして可視化するWordCloudという方法では、
・ある程度はスピーチのメッセージ性を解釈できる
・バッハ会長のスピーチのメッセージ性はなさそう

でした。もちろん他にも形態素解析の手法はあるので今回の結果だけでバッハ会長のスピーチを評価できませんが、やはり多くの人が長いなと感じてしまうスピーチは話にまとまりがないのかなと思うので違和感のない結果かなと思います。

今回の内容はいかがだったでしょうか?
面白いなと思ったり、少しでもデータ分析に興味を持っていただけたら嬉しいです。

この記事が気に入ったらサポートをしてみませんか?