見出し画像

自然言語解析からみえた、藤井風さんの意外な歌詞世界

プログラミングの勉強も兼ねて藤井風さんの全23曲の歌詞を自然言語解析してみたのですが、Twitter上での反響が思いのほか大きかったので、分析からみえてきた知見について、noteにも加筆修正してまとめておきます。

当研究室でもたびたび分析対象とさせていただいている藤井風さんですが、今回は日本語でリリースされている全23曲分の歌詞をプログラミング言語Pythonを使って自然言語解析してみました。

まずは頻出語を直感的につかむため、ワードクラウドとして視覚化してみましょう。各ワードの大きさは出現頻度の多さに対応します。

すると「何」「ない」が頻出語トップ2らしいということがわかりますね。

例えば「まつり」のサビには「何」「ない」が同時に使われています

祭り 祭り あれもこれもが大当たり
比べるものは何もない 勝ちや負けとか一切ないない

藤井風「まつり」より

ちなみにこれら「何」「ない」のような、日常会話でもごく一般的に使われる語は、自然言語解析ではストップワードといって、分析に有用では無いとして初期の対象から除外します。

当室でも最初「ない」を除外して進めたのですが、元の歌詞での使われ方を確認するうち「これは絶対に外してはいけない、重要な語なのではないか…」という思いが強くなり、「ない」も含める形でやり直しました。

「何」「ない」は最頻出の語であるというだけでなく、媒介中心性でもトップ2となっています。次の図はサンバーストチャートといって、階層化されたデータをドーナツ状のグラフで表したものです。

内側の円は、一緒に使われる頻度の高い語のコミュニティ(グループのような塊)を示します。外側の円は、そのコミュニティに属する語の媒介中心性の高さを面積で表しています。ご覧のように、「何」はコミュニティ0の中で最も高い媒介中心性を示し、「ない」はコミュニティ2の中で最も高い媒介中心性を示しています。

ネットワーク科学におけるこの場合の媒介中心性というのは、これらの語がないと、歌詞がバラバラになってしまう、意味が変わってしまうような、ハブのような役割の語ということです。

つまり「何 = what」「ない = not」という、非明示的で、否定的なニュアンスを持つ語が、藤井風さんの歌詞においては欠くことのできない重要語となっている可能性があるということになります。

そして、コミュニティ2においては「ここ」が最も高い媒介中心性を示していることを覚えておいてください。

次に同じデータを共起ネットワークで視覚化してみましょう。

「何」「ない」と同じ色の語に着目することで、それぞれどんな語と一緒に使われやすいということがわかります。 「何」は非常に多様な語と共に使われ、 「ない」は「あなた」「愛」「笑う」、 「ここ」は「人」「生きる」、などですね。

「何」「ない」自体は、不安定で否定的な語ですが、藤井風さんはそれを通じてポジティブなことを歌おうとしているように思えます。

ここで主な出現語の頻度を俯瞰してみてみましょう。

先ほど「ここ」が媒介中心性の高い語であると述べましたが、一方で、2010年台の邦楽で特徴的に使われていたとされる「未来」(参考1)はここには出てきません。データ全体を確認してみましたが、23曲で一度も使われていない

(例えば「未来」が出てくる2010年代のヒット曲には宇多田ヒカルさん「Flavor Of Life」があります。下記の箇所です。)

藤井風さんは、まだ目の前になく、遠くにある何かというよりは、もっと近くにあるもの…「ここ」にあるものを大事にする歌詞ということなのでしょうか。

また、2020年代のJ-POPで頻出するとされる「幸せ」(参考2)は、23曲で4回しか出てきません

(例えば「幸せ」が出てくる2020年代のヒット曲にはDISH//さん「猫」があります。下記の箇所です。)

3曲中で4回しか使っていない「幸せ」ですが、うち3回は「damn」で使われています。

それは「〇〇が幸せだよね」という文脈ではなく、「幸せってどんなだっけな.../何色だったけな...覚えてないや」というように、やはり「幸せ=何?」という文脈で使われているのです。

藤井風さんの歌詞に「何」が頻出することについては、「何なんw」というメジャーデビュー曲があるので、それの影響ではないか?と思われかもしれません。

しかし「何」を含む語がどの曲でどれくらい使われているか、頻度と構成比を視覚化してみところ、「何なんw」での出現頻度は全体の25%に過ぎず、残り75%は他の16曲で使われていることがわかります。

ここまでみてきた自然言語解析結果からは、藤井風 さんは、何 = what、ない = not, nothing、といった一見、非明示的だったり否定的な語を多用する表現者という一面を持っていると言えます。

ところがその歌を聴いて私たちが抱く感情はまったく逆の、満たされた感覚ではないでしょうか。

去り際の時に 何が持っていけるの
一つ一つ 荷物 手放そう
憎み合いの果てに何が生まれるの
わたしわたしが先に 忘れよう
あぁ今日からどう生きてこう

藤井風「帰ろう」

音楽は本当に不思議です。

京都・妙心寺退蔵院の松山大耕副住職は、仏教の中でも禅の教えは、何かを得ようとする「ゲイン」の発想ではなく、積み上げてきたものをあえて崩す「ルーズ」の発想を土台とすると書いています(松山大耕著『ビジネスZEN入門』講談社 2016年)。

ご本人はベジタリアンとのことですが、藤井風さんの歌詞はまるで、何もかも、自我すらも捨てることを通じて悟りに至る禅の教えを読んでいるようです。

***

最後に、今回の歌詞分析でデータを見ていて少し気がついたのは、固有名詞をほとんど使っていないのではないか、ということです。

そこで品詞別分析を視覚化してみました。下図は名詞について行ったものです固有名詞が皆無なことがみて取れます。

グラフ中、固有名詞がわずかに出現しているようにみえますが、"モン"(もの)などの口語等が、自然言語解析のプログラムに固有名詞であると認識されてしまっているだけで、実質はゼロでした。固有名詞が「ほぼ無い」ことを示すため、グラフから削除せず敢えて残しています。

ちなみに「何なんw」の歌い出しには、

あんたのその歯に はさがった青さ粉に ふれるべきか否かで 少し悩んでる
口にしない方がいい真実もあるから…

藤井風「何なんw」より

という歌詞があり、「青さ粉」、つまり青のりのことが出てきます。

「青さ粉」という商品名が存在するので、一瞬固有名詞かとも思えますが、特定のブランドの青のりが歯についているという歌詞ではないと思われるため、元の解析結果のまま(形容詞"青"+名詞"さ" "粉")にしてあります(笑)。

他のアーティストさんの歌詞に固有名詞がどれくらい多いかはここでは検証しませんが、ブランドの固有名が出てくる楽曲として例えば椎名林檎さんの「丸ノ内サディスティック」は、曲名以外に東京の地名が複数出現し、歌詞の中には有名な「リッケン620頂戴」「あたしをグレッチで殴って」というように、ギターのブランド名が出てきます。

また地名の固有名が出てくる楽曲としては、例えばきのこ帝国さんの「東京」に、東京という地名が曲名以外に3回出てくることを思い出すことができます。

固有名詞がほぼ無く、普遍的な歌詞で歌い切る点も、藤井風さんの歌詞世界の特徴かもしれませんね。

なお当研究室がSpotifyのデータを使って分析したところ、藤井風さんは現在最も多くの国で聴かれているJ-POP出身アーティストであり、その再生回数は既に6〜7割が海外のリスナーによって占められており、かつ地球上で最も聴かれているJ-POPアーティストである可能性が見えてきました。

今回分析した藤井風さんの歌詞世界は、今後は英語表現とのハイブリッド、もしくは全編英語歌詞になっていくのかもしれません。楽しみです。

いずれにせよ非常に高揚する分析経験でした。そんな歌詞を書いてくださった藤井風さん、またTwitter上で様々な示唆を与えてくださったファンの皆様、ありがとうございました。

最後に当研究室が愛聴する藤井風さん「帰ろう」の一節を紹介させていただきます。

ああ 全て与えて帰ろう  ああ  も持たずに帰ろう
与えられるものこそ 与えられたもの
ありがとう、って胸をはろう

藤井風「帰ろう」

以上、徒然研究室でした。

(2022年12月29日追記)

2022年12月28日にNHKで放送された藤井風さん特番組中 で、藤井風 さんが "あなた"という歌詞について「ワシ的には自分の中にいる愛おしい人、自分の中にいる最強の人」「それを忘れてしまっては死んだも同然」と仰っていまたのが印象的でした。"あんた"も含めた出現回数を楽曲別に視覚化してみましたが、これらの語は「死ぬのがいいわ」で最も多く使われていますね。


謝辞
今回の自然言語解析の視覚化の一部には、たかぱい@takapy0210 さんのPythonライブラリ「nlplot」を使用させていただいております。ありがとうございます。


(参考1, 2)2010年代、2020年代の邦楽で特徴的に使われる言葉についてのデータはこちら。

この記事が気に入ったらサポートをしてみませんか?