ポリバケツ語から眺める
この記事は「言葉遊び Advent Calendar 2023」の15日目の記事です。
今年はアドベントカレンダーをはしごしているので,軽い気持ちでエントリーしたのですが,既に公開された記事を読んだら凄すぎて…私のは箸休めだと思ってもらえるといいかと。
さてもう去年ですが,以下のツイートがバズりました。
後からこういうa, i, u, e, oが全て1回ずつ入っている言葉をポリバケツ語と呼ぶのを知りました。
ちなみに引用RTされたこのツイートが万バズ状態です。コレクターすげー。
リプライやRTがたくさん届いたのでせっかくなのでひとつずつExcelにまとめ,310個のポリバケツ語が集まりました。
ちなみに私の元ツイートだけだと同じ母音が2回以上出てくるものなどもあったので,それらは除外してあります。
数を集めて何をするのか。私の本業(とは?)は言語学者です。こういう数を集めた言語資料をデータベースまたはコーパスと呼びます。両者の区別は本題じゃないのでいいとして,データベース化することで計量的な分析がしやすくなりましたのでやってみます。
気になったのは母音の並び方です。何も考えなければ数が変わらず20%ずつになることが期待されます。ではどうでしょうか。
1番目の母音は/i/と/u/が少なく,/a/が多いです。一方2番目は/i/が多く,/o/と/a/が少なめです。このような感じで順番によって母音に偏りが見られました。このうち最も顕著なのは1番目です。どうしてこのような分布になったのでしょうかひとつ考えられるのは,もともと日本語の最初の母音には/a/が多く/i/と/u/は少ないというものです。
日本語の語頭での音の並び方の資料はいくつかありますが,アクセスしやすい入江さやか (2012)「日本語の音素の分布・配列に関する歴史的研究」という論文にある,『中央公論』の音素分布を見てみると,語頭の/a/はたしかに多いのですが,次は/i/が多く,ちょっと一致しません。
ただ,何か意図的に言葉を浮かべるとき,母音/a/を含むものから始めるというのは日本語の音の配列の特徴に従っているとまでは言えそうです。
本当は最初の2モーラ(=仮名2文字)の並び方もかなり偏りがあるので,そういうデータを見るのがいいのですが,ちょっと終わりそうもないのでこの辺で今回はおひらきにします。