見出し画像

ラッパーのボキャブラ・ランキング

 ラジオを聞いていたら、ラッパーの語彙力の話題が出てきたので、記事を漁ってみたらこんな記事に遭遇。

The Largest Vocabulary In Hip Hop
Rappers, ranked by the number of unique words used in their lyrics
https://pudding.cool/projects/vocabulary/index.html

一応、コトバがらみということで紹介してみる。

↓以下ざっくりな意訳(正確さを求めるなら原文を)

ラッパーのボキャブラリーランキング!
byマット・ダニエルズ
このプロジェクトは元々2014年リリースされ、最新では2019年1月に更新され、新しい歌詞データと、Lil Uzi Vert, Lil Yachty, Migos, そして 21 Savageなどの75人のアーティストの新しい歌詞データが追加された。
 ここではヒップホップのメジャーどころのアーティストの語彙数を比較できる(これは、タヒー・ヘンプヒルによって示された叙情性の定量化というやつだ)。分析には各アーティストの「最初の35,000語」を使用した。このようにして、Jay-Zのような多作のアーティストを、Drakeなどの新しいアーティストと比較することができる。

 その「最初の35,000語」の内訳は3〜5枚のスタジオアルバムとEPから、それでも35,000語に満たないアーティストについては、ミックステープも含めた。実はかなりの数のラッパーは、十分なオフィシャル音源を持たない。たとえば、Biggie、Chance the Rapper、Queen Latifah、El-P等々)。

 このプロジェクトの最初のリリース以来、新しめのアーティストについてはユニークワードが少なくなるという傾向がみえる。これは、下の表で顕著だ。ここでは、アルバムリリース日に基づいて、各アーティストの活動の主たる10年で色分けしてある。

※図・表は元サイト参照のこと
https://pudding.cool/projects/vocabulary/index.html
(本文中のユニークワードのユニークとはユニークIPとかと同じニュアンスでダブらないみたいな意味)

 新しいアーティストの中には、比較的少ない語彙の者も多いが、これはヒップホップが「ダミングダウン」したためではない。むしろジャンルは進化したのだ。それは複雑なリリック構造から伝統的なポップミュージック化したともいうよう。(同じ歌詞をくりかえす歌ような)。(Joe Carmanicaはこの傾向について、ニューヨークタイムズで書いたが、それによれば、Drakeがここ10年でその形式を普及させたとのこと)。
ここでいったん訳中断

★★さて、「ダミングダウン」と言う言葉について説明せねばならない(タイムボカン・リスペクト)
「教育、文学、映画、ニュース、ビデオゲーム、文化における知的コンテンツの意図的な単純化」ということだが、教科書など教育コンテンツのアホ化などがアメリカでは問題になつているそう。そこだけ聞くと日本の「ゆとり」みたいなこと?と軽くみがちだがその後ろにはキリスト教原理主義などのパワーが働いているのだとか。単純に「ダミングダウン」とカタカナでググれば「論文」がたくさん出てくるので各自確認されたい。

↓以下から記事の訳にもどりやす。

Lil Uzi Vertの語彙数(2,556)は、ビヨンセ(2,433単語)や彼に影響を与えたマリリンマンソン(2,466単語)といったポップスターと近い。

 (語彙が少なくなるという流れ中には)ジャンル・ベンディングするアーティストもいる。 If Childish Gambino’s Awaken, My Love! を言葉が「密」なWu-Tangのアルバムと比較するのはフェアとはいえない。というのも音楽のジャンルによっても語彙数の傾向はかわってくるからだ。下のグラフは、ロック、カントリー、ヒップホップの500のランダムサンプルから35,000語を取得し調査したものだ。


※図・表は元サイト参照のこと
https://pudding.cool/projects/vocabulary/index.html


 つまりアーティストがヒップホップの曲の構造から離れると、彼らの語彙数は減少すると推定される。この結果はこれはこれで興味深い。データセット内の150人のアーティストのうち、誰がトップであるかを見てみよう。

#1-Aesop Rock
 この分析を最初に発表したとき、Aesop Rockを除外したのだが、Redditのヒップホップコミュニティは、Aesopが絶対に1位になると大騒ぎになり、いれてみると案の定、Aesop Rockはデータセット内のすべてのアーティストをはるかに上回っていた。

#2-Busdriver
 最新のアップデートでは、読者からのリクエストでは、Busdriverはウィッシュリストで一番人気だった。彼とAesop Rockだけが最初の35,000語の歌詞で7,000語彙を超えた。

#4、#5、#7、#10、#15、および#20-Wu-Tang Clan Ain't Nuthing ta F' Wit
 #5のウータン・クランは、スタイルが大きく異なる10人のメンバーが同じように歌詞を 提供していることが印象的だ。GZA、Ghostface、Raekwon、Method Manのソロ作品もトップ20に入っているという事実も付け加えておく。中でも、GZAは4位だ。

#28、#54-アウトキャストとE-40
 もちろん、E-40も上位20%にランクインしている。彼は多くのスラングの発明者でもある。彼が作った、或いは広めた言葉には、「all good」、 「pop ya collar」「shizzle」そして「you feel me」など。
 Outkastの場合、その広大な語彙自体が、間違いなく彼らの特徴のひとつといえる。よく使われる合成語には(「ATLiens」、「Stankonia」など)、南部風発音からきた(「nahmsayin」、「ery'day」など)、純粋な造語としては (たとえば、「flawsky-wawsky」)。

#49と#59- Busta RhymesとTwista
 両方のラッパーはそのスピードで知られているにもかかわらず、彼らの詩が他の仲間と同じようにリリカルであるというのは素晴らしいことだ。


では、これはどうだろう?
io9のライターであるロバート・ゴンザレスは、「ブラック・アルバム」のトラック「Moment of Clarity」で、JAY・Zは彼の叙情性を CommonとTalib Kweliの叙情性と対比させている」と書いている(どちらも彼より上位にランクされている)

♪おれが金儲けのためにダミングダウンしたって奴らは批判するが
それでもお客は「ホラ!」って叫んでくれるよ
テクニックで売れるっていうのならそうするさ
Talib Kweliみたくあたり前のように韻を踏みたいのはやまやまだけど
でも、儲かっちゃったから、そうしない

Commonというラッパーの名とコモンセンスをかけている。

このブロジェクトではトークン(字句)分析と呼ばれる調査方法を使用して、各アーティストの語彙を決定した。pimps、pimp、pimping、およびpimpinは4つの固有の単語といてカウントされる。アポストロフィの問題(たとえば、pimpin 'とpimpin)を回避するために、アポストロフィはデータセットから削除される。それはまだ、ヒップホップには区別がめんどくさいスラング(たとえば、shortyとshawty)だとか複合語(たとえば、king shit)、フィーチャリングのボーカリスト問題、繰り返しのコーラス問題などが残る。

ヒップホップのより定量的な分析をお探しの場合は、タヒー・ヘンプヒルの多くの基本的なプロジェクト(分析記事にもに影響を与えた)とマーティン・コナーのラップ分析を参照されたい。
https://www.tahirhemphill.com/
https://www.rapanalysis.com/

語彙カウントデータはこちらから入手可能。
https://docs.google.com/spreadsheets/d/1HIIfgDpNMM-j0hoQHN-yP5P1lNOfJuvym0u0sdWwD9g/edit#gid=737896402

現在除外されている注目のアーティスト:Cardi B、Dej Loaf、Princess Nokia、Rae Sremmurd、Dreezy、Remy Ma、Dej Loaf、Da Brat、Princess Nokia、Queen Latifah、Azealia Banks、Nav、Dreezy、Earl Sweatshirt、Eyedea 、Jay Electronica、Pharoahe Monch、Pusha T、Saba、Waka Floka Flame、XXXTentacion。
ざっくり訳以上

ところで文中に二度出てきた、タヒー・ヘンプヒルさん。
彼こそヒップホップの歌詞データベースの始祖的な存在といえそうなのに、あちこちで引用されているのはここのPUDDING COOLの記事ばかり。
 ふと伝説のハッカー、キャプテン・クランチこと、ジョン・ドレイパーの不遇を思い出してしまった。彼はいわばあのスティーブ・ジョブズやウォズニアックの「パイセン」なのだが、このドレイパーから教わった「電話のただがけマシン」を売りまくったお金でアップルを作ったジョブズらとは対照的にジョン・ドレイパーは逮捕されてしまった。というようなことが朝日パソコンという雑誌のインタビューに載っていたのだが、なぜ取材を受けたか?の説明でなにか仕事につながればいいというなことを言っていた。どうやら彼は日本をIT先進国と誤解していたようだ。
 さてキャプテン・クランチというのは朝食用シリアルのことで、そのおまけについていた「笛」が長距離電話のタダがけトーンの2600KHzと偶然にも一致していた。今は家電は激減してるから確認しずらいだろうがプッシュホンというのはボタン操作そのものでスイッチを押しているのではなく、ボタンを押して出る「音」の高さでダイヤリングしている。絶対音感の姉妹が「声」で電話をかけるなんて実験をテレビでやってたっけ。
 「2600」というハッカー雑誌の名前はここからきている。時報の音が「ラ-440Khz」だから2600KHzというと高い高い「ミ」ぐらいだろう。

 ヘンプヒル氏のプロフィールを見ると少年時代の80年代にはコモドールコンピュータをダイヤルアップモデムにつないでハッカーのようなことをしていたみたいに書いてあったのでますます同じ匂いがする。(ジョブズらとはひとまわり以上ちがうが)
 どうやら彼はあのTEDにも登壇しているようだ。なんで彼のプレゼンテーションをNHKは放送しなかったんだろう。

 お名前ZINEに割り込ませたので、もうひとつ説明しとくと、Tahirという名前は珍しいがアラビア語由来の名で「高潔」という意味なのだとか。hemphillヘンプヒルも日本人は、はじめて聞く名前かもしらんが実はヘンプヒル恵という名の陸上選手がいる。直訳しちゃえば「麻丘」ということになり、日本語だとなんか生徒会長みたいな字ズラの名前だが、「麻」という字に注目してハッカーのルーツを考えるとなんだか雰囲気でちゃう名前だ。


 ところでこのPUDDINGの記事を引用した数多の記事の中に
Shakespeare vs Aesop Rock A Vocabulary Smackdown
なんてのがあった。
https://www.fastcompany.com/3030119/shakespeare-vs-aesop-rock-a-vocabulary-smackdown

シェイクスピア対Aesop Rockのボキャブラリー・プロレスだ!
というニュアンスだろうか。
あのシェイクスピアも造語の天才で1700もの単語を作ったといわれている。
日本だと夏目漱石あたりか。そういえば、あの「アイラブユー」の訳が「月がきれいですね」のはなしはガセネタだってね。

 そんなこんなで「単語」のせつめいとか足したりするので、もし面白いと思ってくれた方はあとでまた見にきてちょ。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?