見出し画像

「海」の定番ミュージシャンって何を歌って定番になってるの?(あるいはテキストマイニングについての触りの話)

日本財団と京都大学の共同事業であるRE:CONNECT(リコネクト)では、「森・里・海をつなぎなおす」ことが理念に掲げられています。このうち「里」は私たち人が暮らす場を指すので、自然環境と人間との関係を再構築する研究プロジェクト、と言い換えられるかもしれません(仮公式ページはこちら)。

その中でも特に「海推し」なのがこのプロジェクトの特徴です。つまり海と人との関係が大切な研究主題のひとつになっているわけですが、今回はある意味で身近なところから海について触れつつ、テキストマイニングについて説明したいと思います。

COVID-19が猛威を振るう今年ほど、ここ日本で多くの人にとって「海が遠かった」夏はかつてなかったのではないか、と思いますが、気分だけでもということであつ森で浜辺に…の他に、夏の風物詩みたいな音楽を聴いていた人は多かったかもしれません。たとえ海なし県に住む人でも、「海といえばこのミュージシャン!」といえる定番の1つや2つはあるかと思います。その答え次第で世代や性別が推測できそうなものですが、2016年に行われた「海の似合う音楽アーティスト」の総合ランキングというものによると、1位はサザンオールスターズだったようです(海水浴場だけでなくカラオケボックスも遠かった今夏は、このランキングのみなさんも印税的な意味で「こんな夏はじめて」と思われたかもしれませんね)。

ランキングの中身はともかく、この「海の定番ミュージシャン」たちっていったい何を歌っているんでしょうか。人々の頭の中で海と彼(女)らとを強く結びつける曲なわけですから、歌詞には海に対するある種の印象を形作る表現が埋め込まれていそうです。

では、まずはさきほどのランキングtop20から、The Beach Boys以外の邦楽ミュージシャンの歌詞を入手します。よく利用されている歌詞情報サイトで「海の似合う」19組のミュージシャンを検索すると、計3942曲が登録されています。このうち「海」を含む歌詞601件が分析対象となるので、せっせと写し取って…はいられないので、プログラミングコードでテキストデータを研究用に一気に取得してしまいます(このスクレイピングのコードはこちらを参考にしました)。

データの内訳は以下の棒グラフの通りですが、曲数ではTUBEがぶっちぎってますね。サザンに次いで海が似合うといわれるわけです(TUBEって筆者は「シーズン・イン・ザ・サン」ぐらいしか知らないのでピンと来ていないのですが、むしろ夏以外の曲ってあるんですかね?)。逆に「三代目」さんはわずか3曲で8番目に海が似合うというアンケート結果だったので、海が似合っちゃう1曲当たりの費用対効果?がとても高いといえます(ORANGE RANGE、キマグレン、Def Techなんかよりも上位!)。

画像1

さて、表形式のデータとして歌詞のテキストがそろったところで、次にこれをテキストマイニングのソフトにかけます。テキストマイニングとは文章(text)から数値にできる情報を取り出す(mining)技術なわけですが、ここでは文を単語単位に分解してその出現頻度を統計的に分析するような処理を行うことになります。ググってみると「このプログラミングコードでワードクラウドが作れるぜ」みたいな親切なページがたくさん出てきますが、ここは何もプログラミングなぞやらなくても、信じられないほど親切な研究者たちが無料で公開してくださっている敷居の低いフリーソフトがいくつかあるので(TTMとか)、今回はその中からKH Coderを使います。

KH Coderでは、GUIでポチポチと操作するだけで!簡単な解析ならひょいひょいとできてしまします。ただし今回は歌詞の分析ということで、「ない」「する」「なる」「ある」「いる」といった文脈と無関係に頻出する単語は予め除外しています。

まずは視覚的にわかりやすい共起ネットワークから。

共起ネット_90w

全体の10%以上の曲に登場している単語90語を分析対象としていて、より濃い線で接続されている単語どうしは同じ曲中に出現する頻度が相対的に高いことを意味しています。色分けはまとまりのよさを表しますが、距離に意味はありません。また、上位60組の強いつながりを表示しているので、対象となる単語のすべての共起関係を表示しているわけではありません。

上の図をみてみると、「海」が中心でよく出てきている(円が大きい)のは当然のこととして、やはり「夏」も2番手ぐらいの勢力を誇っているのがまず目に入ります。少し興味深いのは、「海」とよくつながっていて頻出なのは「夢」「空」「今」であるのに対して、「夏」の方は「恋」「愛」が隣に来ています。海は爽やかな情景の役割を果たしている一方で、夏は流行歌の中では甘酸っぱい季節なのかもしれませんね(たぶん、2020年はみんなにとって違ったけど)。それから、コンビが何組かあって、「季節・変わる」「燃える・熱い」「夜・星」「今日・明日」、そして「心・言葉」…どれもコロケーション的にさもありなんって感じです。右下は(邦楽だけど)英語の歌詞がまとまっちゃってますが、これはDef Techのせいでしょうか。

そんなわけで、どの単語がどのミュージシャンの仕業なのかもみてみます。まずはほぼ同じ条件で共起ネットワークから。

共起ネット_90w_artist_ori

なるほど。中央下をみると、英語の歌詞はやはりDef Techのシェアが大きかったわけですが、AKB48(姉妹グループやらパロディやらで「AKB48・48」状態になっていて、筆者はついていけなくなって久しいです)や嵐といったアイドルグループも関与していた模様です。中央右では、サザンが「OH」とよく歌っているようですが、桑田佳祐の「OH」は歌詞に数えられていたようですね。1つ前の図で目立っていた「夏」や「夢」にはTUBE・サザン・加山雄三がいちばん寄与していたようにこの図ではみえます。全体の外側に伸びている枝の先の単語をみていくと、それぞれが各ミュージシャンを特徴づけている様子がわかります。たとえば湘南乃風だと、「いつか・自分・変わる」とか(らしい?)。嵐なんかは明るく華やかなイメージ通り、「信じる・未来・想い」なんかが外側に伸びています。B'zの「人・見つめる・言葉」は何か大人です。あと、ファン層が一致しなさそうなサザンとAKB48とが「太陽」「恋」「I」だけの経由でつながっているのは、桑田佳祐と秋元康が同世代だからでしょうか?

それから、対応分析というものもみておきます。

対応分析_90w_artist_ori

こちらは二次元上の距離が意味を持ち、近いほど共起の頻度が相対的に高いことになります(なお、上の図は原点付近を拡大した表示になっています)。これでみると先ほどの共起ネットワークとはずいぶん印象が違い、AKB48と最も近いのはなんとサザンではなく加山雄三です。T.M.Revolutionも近い(なんで?)。また、Def Techが英語にはつきものの「THE」とともにぽつんと離れているのも特徴的です。ただし、「海」から近い「夏」や「夢」にTUBEや加山雄三が近いことは先ほどの図と共通しています。

なぜこんな違いが出るのかというと、解析方法の違いとそのときのパラメータの調整に起因します。したがって、こうした分析をする際は1度の解析だけで結論を出そうとするのではなく、いろいろ調整して解析を繰り返す中でデータの特徴を把握していくことが大切になります。それを踏まえて結論めいたことをいうと、流行歌ではどうやら「海」は「夏」という季節の甘酸っぱさの爽やかな背景として取り上げるのが定番で、その他の装飾的な表現でミュージシャンごとの差異があるようです。いわれてみれば「だろーよ!」と言いたくなるところですが、たとえば冬の冷たい海や暗い夜の海、あるいは荒れ狂う海がこの「定番」と対置されるわけで、そういう要素から思い浮かぶのは演歌ではないでしょうか(北島三郎とか石川さゆりとか…ジェロとか?)。でも演歌歌手は「海の似合う音楽ミュージシャン」には1人も入っていませんでした。その理由は、もしかするとアンケートの回答者が10~30代だったので、演歌ファンが少なかったからかもしれません。だとすれば、世代が異なれば「流行歌」が作り上げた海の印象も異なるのかもしれませんね。そこは、「今後の研究が期待される」という常套句で片づけておきます。

ちなみに、いまこれを読まれた方は今年の夏、例年とは違う音楽を聴いていましたか? それともお決まりの夏!海!太陽!な曲だったでしょうか? コロナ渦で音楽の聴取行動って変わるんですかね? かくいう筆者は、夏の作業中はlofi hiphopという完全にインドアかつオン・ザ・チェアなジャンルの音楽を垂れ流していました…そしていまも。ではまた次回。

この記事が気に入ったらサポートをしてみませんか?