僕でも書ける❕K-POPのJapanese ver.~Boys group~

お久しぶりです。抹茶です。無事大学生になれました。

UNINEは解散してしまい(鬱)最近はK-POPを聞くことが多いです。男女問わずいろんなアイドルの曲を聴いているわけですが、

K-POPのJapanese ver. 毎回歌詞似てね????

や、ごめんなさい叩かないで… だって「世界」とか「今この瞬間」とかめっちゃ出てくるじゃん...

ということで(ということで)最近大学でちょっとやってみたテキストマイニングを使ってK-POPのJapanese ver.にありがちな歌詞を数字で出してみます。


テキストマイニングとはなんぞや

引用 Wikipedia:テキストマイニングは文字列を対象としたデータマイニングのことである

だってさ、あとは自分で調べてください。今回使うのはKHCoderというソフト(多分ソフト)です。テキストをKHCoderにかけるとそのテキストの中で何の単語がよく出てくるかとか何の単語は何の単語の近くに出てきやすいかとかがわかるってわけよ。


今回の参加者の皆さん

BTS、EXO、NCT127、Seventeen、PENTAGON、Stray Kids

日本語のオリジナル曲があるこの6組の計109曲をKHCoderにかけます。なんでこの6組なのかって?私の独断と偏見です。

頻出語

まずは頻出語、何の単語が多く出てくるかってことですね。今回はトップ9.10あたりまでを見ていこうかなと思います。

1枚目は代名詞、名詞、サ変名詞、形容動詞です。

画像1

ほ〜ら言った通りやんか❕❕

堂々の代名詞第1位は「君」!回数的に「僕」の2倍以上あるので「君と僕」という組み合わせだけが多いというわけでもなさそうですね。あと意外と「俺」の歌詞あるんだね。

そして名詞第1位は「世界」。名詞のトップ10が入ってる曲、確実に思いつくのではないでしょうか?

「世界」→今ここから世界が繋がる

「自分」→今日も違う自分がいて

「言葉」→「好きだよ」って言葉に出来ずに

(誰の何の曲の歌詞でしょうか❔)ほらね、もうあ〜〜ありそ〜〜〜ってなるでしょ

気付きたくなかった第1位😄

形容動詞の第2位見えます?「マジ」KPOPトンチキ歌詞認定されがち「マジ」がランクイン❕トンチキだけど多いんですねえ。てか「マジ」って形容動詞なの?

さあ、2枚目は感動詞、動詞、形容詞です。

画像2

特になんとも…って感じですね。「さぁ」「さあ」は確かに良くありがちかも?でもKPOPに限らずジャニーズとかにもありがちな感じがします。形容詞で「遠い」「怖い」のようなネガティブなイメージの単語が多く見られたのは意外ですね。そんなにKPOPの日本語版って鬱曲ばっかだっけ⁉️

共起ネットワーーーーーク❕

次にやるのは共起ネットワークといって出現パターンが似ている単語を可視化したものです。「今」が出てきたら近くに「瞬間」があるとかそういう感じね。

線で繋がっている語同士が共起しています(似たような出現パターンであるということ)語のバブルの大きさは単語の出現回数で、線の長さは共起には関係していません。線の部分にある数値はjaccard係数っていう共起の程度を表したもので大きいほど共起の程度が強いことを示しています。見たほうが早いので早く画像見てください💢

画像3

思ったよりも共起してないなあというのがぱっと見の感想です。テキストとして使った曲が109曲でかなり少なめなのも関係していると思います。

それでも注目したいのが青みたいな緑みたいな色(色の語彙力が無い)のところ❕

画像4

「今」「君」の「手」を取って「僕」は駆け出すよ

ほら❕ありそうでしょ❕(即興作詞) 共起ネットワークを使えばありがちな歌詞が誰でも書けちゃうわけですね。これはK-POPに限らない話ですが単語を並べて歌詞を作る作詞家の方もいらっしゃいますもんね。

「君」と「僕」の共起が強いですが、「君」と「今」、「君」と「手」の共起も強いですね。今君と、君の手を、といったところでしょうか。

あとは名詞と動詞が共起していますよね。今回KHCoderにかけた曲の半数以上が元は韓国語の曲だったので(all inじゃなくてtouch Japanese ver.みたいなのが多いってことね、伝われ)翻訳の結果、状況説明みたいな文が多くなったのでは無いかなと思います。

あとK-POPの日本語版は半分くらい英語になりがちですが、今回は英語をネットワークから除外しました(入れたら7割英語になっちゃった、もはやEnglish ver.やないかい)

結論

「君」の「手」を取って「世界」を駆け巡るのがK-POPのJapanese ver.です❕

というのは冗談ですが、

K-POPのJapanese ver.にありがちなフレーズを集めるとありがちなJapanese ver.が作れてしまうのです。



おまけ

コーディングしてみたよ編

コーディングといってどんなテーマ、コンセプトの単語が多いのかを調べてみました❕コーディングの仕方は私の独断と偏見でやらせてもらいます。

こんな感じね

画像5

見にくすぎる 

まずは単純集計

画像6

こう見るとやっぱり恋愛関係のコードの割合高いですね。頻出語の形容詞の部分でネガティブな単語ばっかりだなあ...と言っていましたがポジティブとネガティブのコードの割合に大きな差は見られませんでした。(そこコーディングの仕方じゃね?とか言わない💢)

あとは現代のJ-POPでも同じような傾向が見られますが、過去よりも現在、未来に言及した歌詞がとても多いです。昔の歌謡曲みたいな未練たらったらの曲(少なくともテレビ番組で歌唱するような曲には)あんまり聞かないよね。

次❕クロス集計します。外部変数は歌手にしてみました(カバーかオリジナルもやったけど変わらなかった...)歌手ごとの単純集計みたいな感じです。

画像7

使用した曲数の差はもちろんあるのですが、意外にSeventeenのネガティブのコード割合が高いです。セブチって明るめの曲多いイメージだけど..?となりませんか?私はなりました。(ニワカだから勝手なイメージです)この集計はあくまでもその単語が曲に入っている割合なのでネガティブの割合が高いから鬱曲!とはならないのです。辛いけど僕がついてるよとか悲しかったけど前を向こうとかそんな励ましソングが多かったりするんですかねえ。

あとは一人称のコードの割合がNCT127、EXOは他に比べて低め、というかEXOに関してはゼロ。SMくん、曲の中に自分を登場させたくないらしい。

そしてStray Kidsは他グループに比べて別れと過去のコード割合が高いですね。未来のコードはゼロ。これは鬱曲が多い可能性ちょっとある。対してSeventeenは過去コードの割合ゼロで未来コードが63%とかなり高め。ネガティブコードの割合と合わせて考えると、やっぱりセブチは辛かったけど頑張ろうソング多いんじゃないでしょうか。

恋愛や好意のコードに関してはPENTAGONとBTSが高いですね。BTSは曲数が他よりも多くてこの結果なのでBTSの日本語曲は恋愛ソングが多いと言えるのではないでしょうか。

逆にNCT127とEXO恋愛と好意のコード割合ひっっっく⁉️これは恋愛ソングが少ないのか(繋がる連鎖とかだもんね)はたまた、わかりやすい単語はないけど文脈的にわかる恋愛ソングが多いのか。今回英語を省いているので「Love」を入れると結果が変わったかもしれませんね。


ということでとりあえず今回はここまで!もうちょっと曲数増やして色々やってみようと思うので日本語曲あるグループ教えてください🔆




P.S 全部終わってからシャッフルでWakey-Wakeyが流れ、「ウェキウェキ入れた記憶ねえな...? 」となり、Awakenを入れ忘れたことに気づきました。めんどいからやり直さないよ😆


この記事が気に入ったらサポートをしてみませんか?