見出し画像

100言語で「立ち入り禁止」

翻訳を重ねると文章がどんどん劣化していきます。今回は、シンプルな「立ち入り禁止」の文言をリレー形式で伝言ゲームのようにひたすら100以上の言語で翻訳していきました。さて、どんな文章になったでしょうか?

まずは原文の日本語

こんな文章をつくってみました。

この先、関係者以外立ち入り禁止
無断で入ってはいけません
もし立ち入りを見つけたら、罰金100億円!

罰金の金額はさすがに高すぎですが、まぁよく見かけるような注意文ではないでしょうか?シンプルな文章ですが、翻訳を重ねるとこの文章もどんどん変化していきます。その変遷を見ていきましょう。

2言語目で早くも怪しげな文書に

日本語から、アフリカーンス語に翻訳。さっそく、なにやらおかしな文章になってしまいました。

政党を除く範囲外については、
これは、許可なしに行くべきではありません
あなたが入り口、細かい100億円を見つけたら!

なぜ「政党」?そして、「細かい100億円」って何?

すでにもう、文章がおかしくなってきてますね。続いて、どんどん翻訳していきましょう。

5言語目でもうよく分からないことに

日本語からアフリカーンス語に翻訳したあと、続けて伝言ゲームのようにアルバニア語、アムハラ語、アラビア語と翻訳を重ねました。その結果がこちら。

唯一の政党への損傷
これが出て行くことはありません
ログインする場合は、罰金10000000000

たった5つの言語に翻訳しただけで、もうこんなに文章が変わってしまうんですね。「入ってはダメ」という文章だったはずなのに、なぜか「出て行くことはありません」に変わってる……。そして、「ログイン」はどこから来たのか。罰金の金額は、全部数字になってますが、100億円で合ってますね。

さて、続いて一気に翻訳を重ねましょう。

15言語目、とてもシンプルに

というわけで、15の言語に翻訳してみました。言語の内訳は下記のとおり。

日本語 → アフリカーンス語 → アルバニア語 → アムハラ語 → アラビア語 → アルメニア語 → アゼルバイジャン語 → バスク語 → ベラルーシ語 → ベンガル語 → ボスニア語 → ブルガリア語 → カタルーニャ語 → セブ語 → 中国語(簡体)

そして、今回の文章はこちら。

唯一の敗北
ないから
あなたの美しい百億

リレー形式で翻訳を重ねる時の特徴として、文章がどんどんシンプルになっていくというのがあります。翻訳しきれずに、文章が欠落することがあるのですね。逆に、付け足されることは無いので、結果的にどんどん文章が短くなっていきます。

「あなたの美しい百億」ってなんなんでしょうね?なにやら、ポエムみたいになってきました。

24言語目で衝撃の変化が!

24言語目のエストニア語で、驚きの変化がありました。

唯一の敗北
遠くないから
あなたの美しい60億

なんと、今まで100億だったのが、ここに来てなぜか60億に!なぜ、40億も減ったのでしょうか。謎過ぎます。

衝撃が止まらない、28言語目

これ、マジですか。

28言語目のガリシア語で、またまた数字に変化が。

唯一の損失

あなた美しい600万

60億から、600万に減ってる!そして、二行目がたった一文字「黒」になってるし。

とうとう百万に減額

38言語目のミャオ語で、とうとうこうなりました。

若しくは

この美しい百万

100億円が、100万に……。

ちなみに、ミャオ語というのは、中国南部や、ベトナム、ラオスなどに住むモン族と呼ばれる人たちの言語です。ラオスでの内戦の結果、アメリカに難民として渡った人がたくさんいて、実はミネソタ州では英語とスペイン語に次いで3番目に多く話されている言語なんだって。

という、言語ネタもちょこっと挟みつつ。翻訳を続けましょう。

数字と色が変わってしまう

46言語目、カンナダ語。ここで、数字だけでなく色にも変化が。

若しくは

この素敵万人

そもそも、なんで二行目に「黒」という文字が出てきたのかが不明ですが、さらにこのカンナダ語で色が反転し、「黒」から「白」へ。そしてさらに、「百万」が「万人」に。

そして、この後カザフ語でなぜか「百万」が復活したあと、クメール語でとうとう数字が消失します。

その後、62言語目のマオリ語で色が消失。

64言語目のモンゴルごで1行目が「と」のみに。

79言語目のソト語で全文が5文字に削られ、さらに80言語目のショナ語で4文字に。

そして、最終の104言語目、ズールー語ではこうなりました。



もっと

もはや、立ち入り禁止も、罰金も、何も残ってませんね。

今回、機械翻訳に使用したGoogleスプレッドシートを公開しますので、文章の変遷はそちらで見てみてください。

このスプレッドシートには、機械翻訳の関数を入れているので、最初のセルに文章を入れると自動的に100以上の言語にリレー形式で翻訳するようにプログラムされています。このシートは、自作しました。

翻訳に使用している言語は以下の通り。

日本語 → アフリカーンス語 → アルバニア語 → アムハラ語 → アラビア語 → アルメニア語 → アゼルバイジャン語 → バスク語 → ベラルーシ語 → ベンガル語 → ボスニア語 → ブルガリア語 → カタルーニャ語 → セブ語 → 中国語(簡体) → 中国語(繁体) → コルシカ語 → クロアチア語 → チェコ語 → デンマーク語 → オランダ語 → 英語 → エスペラント語 → エストニア語 → フィンランド語 → フランス語 → フリジア語 → ガリシア語 → グルジア語 → ドイツ語 → ギリシャ語 → グジャラト語 → クレオール語(ハイチ) → ハウサ語 → ハワイ語 → ヘブライ語 → ヒンディー語 → ミャオ語 → ハンガリー語 → アイスランド語 → イボ語 → インドネシア語 → アイルランド語 → イタリア語 → ジャワ語 → カンナダ語 → カザフ語 → クメール語 → 韓国語 → クルド語 → キルギス語 → ラオ語 → ラテン語 → ラトビア語 → リトアニア語 → ルクセンブルク語 → マケドニア語 → マラガシ語 → マレー語 → マラヤーラム語 → マルタ語 → マオリ語 → マラーティー語 → モンゴル語 → ミャンマー語(ビルマ語) → ネパール語 → ノルウェー語 → ニャンジャ語(チェワ語) → パシュト語 → ペルシャ語 → ポーランド語 → ポルトガル語(ポルトガル、ブラジル) → パンジャブ語 → ルーマニア語 → ロシア語 → サモア語 → スコットランド ゲール語 → セルビア語 → ソト語 → ショナ語 → シンド語 → シンハラ語 → スロバキア語 → スロベニア語 → ソマリ語 → スペイン語 → スンダ語 → スワヒリ語 → スウェーデン語 → タガログ語(フィリピン語) → タジク語 → タミル語 → テルグ語 → タイ語 → トルコ語 → ウクライナ語 → ウルドゥー語 → ウズベク語 → ベトナム語 → ウェールズ語 → コーサ語 → イディッシュ語 → ヨルバ語 → ズールー語

電子書籍にしてKindleで販売もしています

で、この自動翻訳のプログラムを使って、昔話の「桃太郎」や「竹取物語」をひたすら翻訳して、それを電子書籍化したものをKindleで販売しています。よかったらそちらも読んでみてください。

「桃太郎」を100以上の言語で翻訳してみた
「竹取物語」を100以上の言語で翻訳してみた

で、この機械翻訳を使いながら電子書籍化してKindleで販売するっていう一連の流れがとても楽しかったので、「大人もできるかな」というワークショップイベントを開催して、友達と一緒につくってみたり。楽しかったです。

「私もやってみたい!」って方がもしたくさんいらっしゃったら、またワークショップをやるかも。定期的に、クリエイティビティとテクノロジーを組み合わせて、みんなでなにかつくって遊んでみるっていう「大人もできるかな」っていうワークショップイベントを開催しています。

過去には、こういったパソコンを使ってつくるものや、音声入力や文字認識で遊んでみたり、都電を貸し切りにして写真展を開催したり、品川で早朝富士登山をしてみたりなど、いろいろやってます。前回は「アイデアを形にする」っていうテーマで、ゲスト登壇者さんがいらっしゃったり、文具メーカーさんが協賛してくれたりも。

次回は、アンバサダーをテーマにした飲み会。好評につき第二回の開催。

一緒に遊びたい方、ぜひ!


「日曜アーティスト」を名乗って、くだらないことに本気で取り組みつつ、趣味の創作活動をしています。みんなで遊ぶと楽しいですよね。