見出し画像

くれないにおう 野なかの薔薇|AI は歌詞のリフレインを認識する?

「♪野なかのバラ」と日本語歌詞のリフレインで歌われるフレーズ。
原文のドイツ語では

 Röslein auf der Heiden

直訳は「野における小さなバラ」である。

私は言語ビッグバン講座のフォーラムへ次のように投稿した。

誤訳とは言い切れないのですが、
この詩の主役である Röslein (小さなバラ)を
Papago も DeepL も放置しているのが気になります。

少し前に書きましたが、
Frau → Fräulein の知識があれば Rose → Röslein も容易に理解できるはずなのに、「異教徒の族長」とか「ロスリン」とか「レッスリン」になっています。
最も不可解なのはドイツ語の基本単語中の基本単語である roth (赤い)が Papago訳では「レッド」という英語 red のカタカナ読みに、
DeepL訳では「ロース」とまんま roth の英語読みになっていることです
普通に散文の中に出てくる roth なら「赤い」と訳せるはずなのに、AI翻訳者の Papago さんや DeepL さんたちは「野ばら」の翻訳ではなぜ「レッド」や「ロース」にしちゃうのでしょうか?

試しに散文でこのように入力すると
Ein Knabe sah ein rothe Röslein.

Deepl訳は、少年は赤いバラを見た。 

となり、正しく翻訳しています。

Papago 訳は、少年が赤い赤いラソレットを見た。 

となってしまい、ちょっと残念ですが rothe という形容詞を「レッド」ではなく「赤い」とちゃんと日本語にしています。

注)現代の正しいドイツ語では ein rotes Röslein です。

私の仮説ですが、AI翻訳は翻訳する文章を、全体の構造から「リフレイン」のある詩歌や歌詞であると認識したうえで翻訳しているのではないでしょうか。
Papago も DeepL も、ドイツ語原文を詩歌や歌詞と認識しているのなら、どうやって? 

これも仮説ですが、
・語順
・改行直前の単語の脚韻
・同じ語の繰り返しやスタンザごとのリフレイン
・相手への呼びかけや応答などのダイアローグ

などがあると推測できます。
歌詞だという認識からリフレインの部分を「異教徒のロスリン、ロスリン・レッド」や「レッスリン、レッスリン、ロース」としているのでしょう。

DeepL さんの場合は、
Röslein auf der Heiden
の行をオリジナルのドイツ語のまま訳さずにそのまま日本語の歌詞の中においています。

これは、J-Pop の歌詞の中に英語の行があって英語で歌われることがあるという DeepLさんの「知識」からくるものでしょう。

日本語の歌の中に I love you... とか Can you celebrate... とかの英語がまじることがあるのを知っている DeepL は、すべてのスタンザに出てくる Röslein auf der Heiden をあえて日本語訳にしないでおき、歌っぽく仕上げたのではないかと私は推測した。

DeepL の仕組みに詳しい人ならもう少しまともな説明ができると思うが。


考察に使った参考文献(リンク)
http://figures-of-speech.com/2017/06/r%C3%B6slein.htm

*記事中に引用した DeepL の翻訳は 2021年8月当時のものです。DeepL は日々進化中のため、現在は引用とは異なる訳が表示される場合もあります。

#言語ビッグバン #AI翻訳 #機械翻訳 #DeepL #Papago #DeepL翻訳  #語学 #外国語教育 #ドイツ語 #詩歌 #ゲーテ #ドイツの詩 #ドイツ語の歌 #クラシック音楽 #声楽 #野ばら #野バラ #わらべはみたり #野中のバラ #シューベルト #ウェルナー #ドイツリート