見出し画像

「ねぎが先か、玉ねぎが先か」問題

はじめに

野菜炒めの順番の話ではありません。名詞の話です

日本語では玉ねぎは「玉+ねぎ」で、ねぎが先に存在している状態から玉の形容部分がついて成り立っています。しかし、英語では玉ねぎがonion、ねぎがgreen onionということで、日本語で考えると「緑+玉ねぎ」がねぎになります

このことに関しては多くの人がTwitterでも言及しており、その言語をまたいだ違和感を感じる人は多くいると言えます

https://twitter.com/search?q=%E3%83%8D%E3%82%AE%20%E7%8E%89%E3%81%AD%E3%81%8E%20onion%20green%20onion&src=typed_query

ただここまでは日本語と英語の話しかしておらず、世界中の言語においてどうなっているのか、というのは未知の領域...ということで、これをテーマに調べることにしてみました。今回は翻訳を調べるのにGoogle翻訳を用いています

Google翻訳結果とその分析

Google翻訳で翻訳可能な以下の言語を対象にしました。全部で108言語あります

スクリーンショット 2021-05-01 18.12.24

日本語のように「玉ねぎ」の中に「ねぎ」の文字列が含まれている場合を「ねぎ先行型言語」、反対に「green onion」の中に「onion」が含まれているような場合を「玉ねぎ先行型言語」として今回は定義して、翻訳結果を分析したいと思います

以下のファイルがその分析結果のcsvです(結果の収集はプログラムで自動で行っています)

スクリーンショット 2021-05-01 18.47.51

ざっと眺めた感じだと、ほとんどが玉ねぎ先行型に見えます(というか日本語と同じパターンなのって韓国語と中国語だけでは...)

「ねぎ先行型言語」「玉ねぎ先行型言語」の分類結果

ここからこの結果を集計して、「ねぎ先行型言語」、「玉ねぎ先行型言語」「それ以外の言語」に分類しましょう

ねぎ先行型言語(3言語)

韓国語
中国語
日本語

玉ねぎ先行型言語(77言語)

アイスランド語
アイルランド語
アゼルバイジャン語
アフリカーンス語
アムハラ語
アルバニア語
アルメニア語
イタリア語
インドネシア語
ウイグル語
ウェールズ語
ウクライナ語
ウズベク語
ウルドゥ語
エストニア語
エスペラント語
オランダ語
カザフ語
カタルーニャ語
ガリシア語
カンナダ語
キルギス語
グジャラト語
クロアチア語
コルシカ語
ジャワ語
ジョージア(グルジア)語
シンハラ語
スウェーデン語
スコットランド ゲール語
スペイン語
スロバキア語
スロベニア語
スワヒリ語
スンダ語
セブアノ語
セルビア語
ソマリ語
タイ語
タガログ語
タジク語
タミル語
チェコ語
チェワ語
テルグ語
デンマーク語
ドイツ語
トルクメン語
トルコ語
ネパール語
ノルウェー語
ハイチ語
パシュト語
バスク語
ハンガリー語
パンジャブ語
ヒンディー語
フィンランド語
フランス語
フリジア語
ブルガリア語
ヘブライ語
ペルシャ語
ベンガル語
ポーランド語
ボスニア語
ポルトガル語
マケドニア語
マラーティー語
マラヤーラム語
マレー語
モンゴル語
ヨルバ語
ラオ語
ラテン語
ロシア語
英語

それ以外の言語(28言語)

アラビア語
イディッシュ語
イボ語
オリヤ語
キニヤルワンダ語
ギリシャ語
クメール語
クルド語
コーサ語
サモア語
ショナ語
シンド語
ズールー語
ソト語
タタール語
ハウサ語
ハワイ語
ベトナム語
ベラルーシ語
マオリ語
マラガシ語
マルタ語
ミャンマー語
モン語
ラトビア語
リトアニア語
ルーマニア語
ルクセンブルク語

かなりの確率で玉ねぎ先行型言語ということが分かりましたね。これから日中韓以外の国の人に対してねぎの話をするときは、少し肩を狭くしていきましょう...
この結果は以下のWikipediaのネギの歴史の項で説明が付きそうです

中国西部やシベリア、アルタイ地方あたりが原産といわれ[9][6]、古代中国の漢代に書かれた『礼記』などの記録から、紀元前200年ごろにはすでに中国で栽培されていたことが分かっている[6]。日本には奈良時代に渡来し、古くから親しまれてきた野菜である[8]。『日本書紀』(720年)の仁賢天皇6年(493年)9月に、「秋葱」の名で登場するのが日本最古の記録といわれている[6]。ヨーロッパへは16世紀になって伝わったが、あまり普及はしなかった[6]。

以上の結果から言語数の比率を知ることができましたが、各言語には母語話者数というものが存在しています。せっかくなので世界の「ねぎ先行型人口」と「玉ねぎ先行型人口」の比率を調べてみましょう

「ねぎ先行型人口」「玉ねぎ先行型人口」の比率

言語コード(jaとかenとか、Google翻訳ではISO639-1)と言語名の対応をhttps://en.wikipedia.org/wiki/List_of_ISO_639-1_codes、言語ごとの母国語話者数をhttps://en.wikipedia.org/wiki/List_of_languages_by_number_of_native_speakers#Ethnologue_(2019,_22nd_edition)から対応させ、各グループの人口を計算しました(表記ゆれ等の対応をしていないので結構漏れがあるような気がしています)
その結果がこちらです

画像4
画像4

Negi-based: ねぎ先行型人口
Tamanegi-based: 玉ねぎ先行型人口
Others: その他人口

ちなみにねぎ先行型人口の8割は中国人です

「ねぎ先行型国家」「玉ねぎ先行型国家」の分布世界地図

最後にせっかくなので、どの国が「ねぎ先行型言語」「玉ねぎ先行型言語」「それ以外の言語」の国なのかを地図にして見てみましょう(ねぎ先行型はもう自明ですが)
どの言語がどの国で使われているかという対応はhttps://wiki.openstreetmap.org/wiki/Nominatim/Country_Codesを参考に、1つ目の言語をその国の言語として今回は採用しています

スクリーンショット 2021-05-02 2.49.16

この対応から、「ねぎ先行型国」「玉ねぎ先行型国」「それ以外の国」に分類して地図上で色分けして表示したものがこちらです(青: ねぎ先行型, 橙: 玉ねぎ先行型, 緑: その他)

スクリーンショット 2021-05-02 2.52.31

以下のページでインタラクティブにこの地図を操作できます

なんと、多くの国が玉ねぎ基準である中、中東アフリカ南部の地域の国でねぎと玉ねぎを別々の単語を用いて表現しているということが分かりました。これらの地域では、ねぎと玉ねぎの伝来がその他の地域と異なる経緯があるのでしょうか...なかなか興味深い結果を残したように思えます
(と言いつつ単純に文字列の比較が上手くいかなかった言語というだけの可能性は十分にありえます...)


この記事が気に入ったらサポートをしてみませんか?