日本にある駅名の母音の使用率(頻度の分布)を調べた話

日本語には a, i, u, e, o の5種類の母音があるが、その使用割合は均等ではない。

このようなデータがある。このデータを元に母音の頻度を計算すると、以下のような結果になる。

a 27.0%
i 20.8%
u 18.5%
e 12.6%
o 21.1%

もし偏りがなければ各母音の頻度は全て20%になるわけだが、実際にはそうではなく、一目瞭然に a が多く e が少ない

だが、これは日本語の文章についてのデータである。日本の地名駅名だとどのような結果になるだろうか。それはデータがなかったので、自分で調べることにした。

使用したデータは「日本駅名語辞典」(第24版 2020年10月版)である。この辞書は、駅名替え歌用に筆者自身が作成した辞書である。母音の配列別に駅名を検索できるようにすることを目的に作ったものであるが、今回の調査にはもってこいのデータだったのでこれを使って分析した。

結果はこの通りである。

a 35.3%
i 24.6%
u 12.1%
e 6.8%
o 21.2%

やはり a が多く e が少ないという結果は変わらなかったが、文章の場合と比べて駅名の方が差が大きく開いている。文章の場合、aの割合は27.0%で、eの割合の12.6%の2.1倍だったが、駅名の場合、aの割合は35.3%で、eの割合の6.8%の5.2倍もある。また、uもかなり少ない。

この辞書の母音の表記は、「ひらがなをどう書くか」ではなく「発音がどうか」によって母音の表記を決めている。例えば「東京」は、ひらがなでは「とうきょう」となるので母音の並びは「ouou」となるが、発音は「トーキョー」なので母音は「oooo」としている。こうした事情があるため u にとっては若干不利で、 o にとっては若干有利ということはあるかもしれない。しかし、そのことは u が20%よりも少なく o が20%よりも多い理由の何割かを説明できるかもしれないが、aとeに開いた格差とは無関係である。

従って、日本語の文章では a が多く e が少ないが、駅名だとその格差がより大きくなると言うことが言えそうだ。

駅名替え歌でeを含む駅名で困る理由

日本語の母音の頻度でeが少ないと言うことは、昔からよく知られている。それゆえ、「駅名替え歌ではe段の入った駅名が貴重」とよく言われる。

しかしこの主張、よく考えてみたらおかしい。日本語の母音の頻度でeが少ないのであれば、駅名に含まれるeの割合も、歌詞に含まれるeの割合も、どちらも同じ割合で少ないはずだ。だから、そもそもe段の入った駅名を使う機会そのものも少なくなるはずであり、e段だけが難しいという状況になるはずがないのである。

にもかかわらず、現実に駅名替え歌を作ってみれば、e段の駅名の選択肢の少なさに右往左往することになるだろう。

この理由が、先述した調査結果で説明がつくようになったことは、非常に画期的ではなかろうか。

a と e の格差は、文章では2.1倍なのに対し、駅名では5.2倍もあるのだから。


この記事が気に入ったらサポートをしてみませんか?