Bar Chart Raceを作ってみようとして、アメリカにおける名前と性別についてのデータをいい加減に眺めてみた

アドベントカレンダー用に書いているのに季節感もなにもないネタですみません。

最近↓のようなものをよく見かけるので調べてみたところ、このようなアニメーションはbar chart raceと呼ばれているらしいと知りました。

どうやらFlourishというサービスを利用すると、スプレッドシート形式のデータセットがあれば簡単にbar chart raceが作れるとのことで、せっかくなので自分でも試しに何かしらのbar chart raceを作ってみようと思いました。

とりあえずひとつbar chart raceのアニメーションを作ってみたかっただけなのでデータセットはなんでもよかったのですが、思いつきで、アメリカで生まれた子供に名付けられた名前のリストを使うことにしました。このリストは、1880年から2018年までの各年に生まれた子供につけられた名前を対象として、それぞれの名前がつけられた子供が何人いるかをカウントしたもので、Social Security Administrationがテキストファイルで公表しています。

データをダウンロードすると、注意点などが書かれたPDFファイルも入っています。

実際にデータセットを取ってみると、名前にはばっちりMとFで性別が割り振られていて、性別について最近よく目に入ってくるいろいろが頭をよぎりつつ、生まれたばかりの子供だとそうなるしかないのかなと思ったりしました。逆にばっちりどちらかに割り振られているようなので、データセットを作るときにそこに着目してもいいかなと思い、①MにもFにも登録のある名前で、②1919年から2018年までにMにもFにも1,000人以上の登録があり、かつ③1919年から2018年までの総人数でみたときに、MとFの比率で小さい方が40%以上となるものを抽出してみました。

つまり、ちゃんとした統計的・社会学的な話はさておき、なんとなく中性的?と思われそうな名前を、恣意的に閾値を切って選び、試しにその名前だけでbar chart raceを作ってみようとしたわけでした。名前の数的にも100ほどでちょうどよかったので、これで作ってみたのが下のbar chart raceです。

バーに表示されている数字は男女合わせた数字です。バーの色は、期間を通してどちらかというとMが多いか、どちらかというとFが多いかで分類しています。1930年前後までは「中性的な名前?」というとJessieが定番だったのが、1960年くらいまではJackieが首位になり、その後はKerryとかCaseyとかJaimeとかいろいろが出てきて、直近ではRileyという名前が首位になっている模様です。

だからなんだということもないですが、こうして「なんでもいいのでなにかのデータを使ってbar chart raceを作ってみる」という個人的な所期の目的は達成されました。

このアニメーションというか、そのうしろにある加工データ自体は、特に何も検証していないので、もしかすると何らかの誤解を招く可能性があるだけであまり有用なものではないかもしれません。

他方で、このデータを作るためにいろいろ眺めていると、ちゃんと調べるといろいろなことを考えることができるデータセットなような気もしてきました。

おそらくすでに無数の研究や考察が行われてきているのではないかと思いますが、例えばかつては女性的であった名前が徐々に男性に用いられるようになっている例や、その逆というのがやはり見受けられます。Frankieという名前は、1920年代生まれでは6,409人中4,918人とおよそ76.7%が女性でしたが、3,790人中1,037人と、27.4%に減っています(2010年代には女性も増えているので、今後の傾向はなんとも言えませんが)。逆に、最近では首位になっているRileyという名前は、急増した1990年代生まれでは29,067人中10,230人が女性でその比率は35.2%でしたが、直近の2010年代生まれでは72,033人中50,330人と、69.9%が女性のようです。人数自体変化しているので、単なる流行の問題ということかもしれませんが、はたしてこういうことから何かしらのインプリケーションを得ることはできるのだろうか。

もう一つ不思議に思われたのが、おそらくは明らかに女性的であるにも関わらず、男性としての登録が一定数ある名前や、その逆。例えばMaryという名前からは、語源的にも女性が想起されるように思いますが、そして実際全期間にわたって圧倒的に女性が多いわけですが、データの取り方が間違っていなければ、1919年から2018年までに12,407人の男性のMaryが誕生しているようです。また、Johnは男性の名前のように思われ、実際ほとんどが男性のようですが、同じくこの100年間で18,752人の女性のJohnが誕生しているように見えます。

単なるデータの間違いなのか、加工の際に何かを誤ったのか、あるいはそう推測することが何かしら失礼にあたるのか。辞書で調べても「女性の名前」「男性の名前」と出てくる程度に一般的なイメージを持った名前だけに、データを眺めても、逆の人々は圧倒的少数派であり続けてはいます。これについても何か文化的、社会的、歴史的な背景があるのかもしれず、ほんのり興味深いような気はしました。(すぐに調べようともならなかったので、先行研究にあたったりすらしていませんが。)

この記事が気に入ったらサポートをしてみませんか?