ユーフォニー指数でいろいろ遊んでみた

ユーフォニー指数という指標がある。これは、すきえんてぃあ氏が2017年に考案した指標で、ある言語が「自然言語らしさ」を持っているかどうかを表す指標である。

ユーフォニー指数は人工言語界隈で定期的に話題になり、時には炎上をもたらすこともあるが、そのような話は今回は置いておき、想像地図世界(想界)の事象を題材に、ユーフォニー指数を算出するということを試してみた。

ユーフォニー指数の算出にはver1.2を使用した。

ラテン文字転写規則の設定

ユーフォニー指数を算出するにあたって、ラテン文字での表記については、以下のようなルールにした。

・「し」はxiで表記し、「しゃ行の子音」は x で表記する(言い換えると、ローマ字の sh は全て x に置換する)

・長音はひらがなの表記にかかわらず、全て同一母音字を2つ並べて表記する(例えば「東京」であれば tokyo や toukyou ではなく tookyoo とする)

・「ん」は全て n で表記し、直後に母音が来るときはハイフンを入れる(例えば「新大阪」は xin-oosaka とする)

・「ち」は txi で表記し、「ちゃ行の子音」は tx で表記する(言い換えると、ローマ字の ch は全て tx に置換する)

試運転

試しに、阪急京都線の大阪梅田から京都河原町までの駅名を並べて、ユーフォニー指数を算出してみる。判定に利用した文字列はこれである。

"oosakaumeda juusoo minamikata soozenji awaji kamixinjoo aikawa xoojaku settsuxi minamiibaraki ibarakixi soojiji tonda takatsukixi kanmaki minase ooyamazaki nixiyamatennoozan nagaokatenjin niximukoo higaximukoo rakusaigutxi katsura nixikyoogoku saiin oomiya karasuma kyootokawaramatxi"

結果:95.95

次は山手線の駅名でやってみよう。

"tookyoo kanda akihabara okatximatxi ueno uguisudani nippori nixinippori tabata komagome sugamo ootsuka ikebukuro mejiro takadanobaba xin-ookubo xinjuku yoyogi harajuku xibuya ebisu gotanda oosaki xinagawa takanawageetowei tamatxi hamamatsutxoo xinbaxi yuurakutxoo"

結果:97.51

実践

それでは同じことを想界の事象に対してもやってみる。

まずは、想界において山手線に相当する都心の環状路線である谷原線の駅名(日本語名)でやってみよう。

"nan-ei sanmitsutxoo fuyuzuki takakura okanobamariaaju uotani iwakawabaxi suxitani umatani amate masuwaka nixikawa tsutsue matsukawayama xin-orihara hooxoo itxitaka doonoue kandori ikeutxi umemoto hisatomi imahori sumitani higaxisumitani kirixima maekata hagimoto utxikawa itxige konoe tatsumon"

結果:97.41

山手線の駅名と谷原線の駅名でさほど数値が変わらないという結果になった。まあ、想界の駅名とは言え日本語名だから当然か

残念ながら谷原線の全駅名の更紗語名は確定していない。そこで、更紗語名が確定した幾つかの駅名を並べた文字列について、ユーフォニー指数を出してみる。実験に使用した文字列はこれである。

"mwasa hwokihyatu aatasi tomojohwa xisoko kyinwo hwebwohwo swaryurisa anaiya hwomwi toosyaka tasimwakyi"

結果:97.99

上記の語彙を日本語に訳すと(地名の場合は日本語に意訳すると)、以下のようになる

"川原 岡野 赤松 たけべ 口広 山田 滝本 谷原 大生 浦崎 末広 松川山"

比較のためにこれをラテン文字表記にしてユーフォニー指数を測定する。

"kawahara okano akamatsu takebe kutxihiro yamada takimoto taninohara oobae urasaki suehiro matsukawayama"

結果:97.78

結果を比較すれば一目瞭然。更紗語も日本語も地名だけを比較すればユーフォニー指数はほとんど変わらなかった。勿論これは文章ではなく地名の語形を比較しているだけであり、代名詞や動詞や形容詞を含んでいないため、これだけをもって更紗語は自然言語らしいということはできないが、地名に関しては自然言語に近いと言っても良いのではないだろうか。

参考

山手線の駅名を漢字1文字単位で分かち書きすると、こうなる(ただし、高輪ゲートウェイは taka nawa geeto wei と4つに分かち書きした)。

"too kyoo kan da aki ha bara o katxi matxi ue no uguisu dani nip po ri nixi nip pori ta ba ta koma gome su gamo oo tsuka ike bukuro me jiro taka dano ba ba xin oo ku bo xin juku yo yo gi haraj uku xibu ya e bi su go tan da oo saki xina gawa taka nawa geeto wei ta matxi hama matsu txoo xin baxi yuu raku txoo"

結果:57.10

このように過剰な分かち書きを行うとユーフォニー指数が下がり、自然言語らしくないと判定される。

この記事が気に入ったらサポートをしてみませんか?