見出し画像

フォント制作の為の「歌詞漢字基準」を作ってみる。

どうも、木葉はづくです。

と思ったので、melonadeさんにjsonを作ってもらいました。(すみませんが今回私が手を動かしているところは無いです。ほぼ全てDTM鯖で通話した皆さんのお手柄です)
データ元はVocaDBからなので完全に全てではありませんが、およそネット文脈の楽曲のデータとして十分な量です。

冒頭5桁の漢字

結果としては順当ですね。常用漢字と被りがちなので、常用漢字外を取得してみると

かなり歌詞らしいリストができました。指摘としては動詞が多いですね、とか熟語になりにくい、というのが挙がっていました。にしてもあまりに歌詞すぎる。
ちなみに一度も使われていない常用漢字は

の8つでした。まじで?

余談ですが、「酩」と「酊」が隣同士で一つだけある「酩」を探したところ、

タコにも人権をッ❗️ 酩ッ❗️

おくとばうんすっ!| Shu feat. たこルカ ( 巡音ルカ )

でした。それと偶然にも「酪」と「酩」が違う漢字であることが発覚し、該当楽曲の歌詞の引用元から、Youtubeの概要欄にある歌詞に誤字を発見しました。「酩酊」を歌詞に使っている人は今の内に今一度歌詞の文章を確認してください。

ここで三面相氏より漢数字ソートの案が出ました。一二三が頻出そうと話していましたが、

まさかの零が上位に来て三を追い抜いていました。このリストで帰れま10をしてみたい。

JSで円グラフにしたが、見た目面白くない。

このデータを元に、フォント制作に使えそうなリストができたら嬉しいなと思っています。ご協力いただいたmelonade氏とDTM鯖の皆さんありがとうございました!

この記事が気に入ったらサポートをしてみませんか?