英詩の翻訳から人工知能(情報)との付き合い方を思案する
序
人工知能は便利ですね。筆者も、WordPress で書いていた文章を「マークダウン記法」に変換してもらうために活用したことがあり、これが大幅な時短となって助かったことを思い出します。
一方で、注意を向けなければならないこともあると考えています。多くの方々が既に述べていますが、"hallucination (幻覚)" と呼ばれる「事実と異なる回答」との付き合い方です。
一般的に、人工知能(大規模言語モデル)の回答は、"collocation (連語、連結語)" に強く依存しています。言語学におけるコロケーションとは、特定の単語が別の単語と一緒に使われる頻度が高い組み合わせのことを指します。
人工知能が回答を生成する際は、大量の文書データを学習し、その中からコロケーションのパターンを抽出します。文法的に正しいのか、母語話者が使用する自然な表現なのか、文脈に応じた語彙が選定できているのか、といった学習データを基に、質問に対して適切な単語や語句を組み合わせて回答を提供しています。
したがって、その回答が正確であるか否かということよりも、言語モデルに従ったという意味での正確性が顕著に現れます。これが "hallicination" の正体です。
さて、この記事を読んでいる皆さんは、ブラウザに備えられている翻訳機能や、DeepL といった翻訳ツールを使用したことのある人がほとんどだと思いますが、これらが「誤訳を回答している可能性」は視野に入れられているでしょうか。
答えは "YES" だと思います。他に娯楽や役に立つ記事が多く存在する中、筆者の記事をここまで読んでいる皆さんのことです。当然、人工知能の利用に関しては一種の心得のようなものがあるはずです。生成された回答を(その必要がある場合は)確認していると信じています。
しかし、それなりに英語を勉強した人でも思わぬ落とし穴があるものです。今回の記事は、その「落とし穴」について、筆者なりの考えをまとめた上で、人工知能との付き合い方を提案することが目的です。
忙しい人のために結論から述べると「分かった気にならないこと」という警句に約言されます。具体的には「単語や文法に誤りがなければ生成された回答は正しい」や「AIが代わりにやってくれるのだから勉強しなくても良い」や「なんとなく意味が分かれば良い」という考えに対する警鐘です。
これらの考え方は、その一瞬、その時々に限った話なのであれば差し支えないと思いますが、それを継続したままだと成長がありません(生き方の問題なので強要する気はありません)
それを「翻訳」の視点からお話いたします。英語が得意な人や勉強中だという人も楽しんでいただけるように工夫して書くつもりです。最後まで読んでいただけると幸いです。
翻訳の可能性について
"Traduttore, traditore" という有名な格言があります。イタリア語で「翻訳家は裏切り者」という意味で、翻訳行為において、原文の意味や微妙な意味の差(=nuance)を完全に再現することができないことを示します。
平たく言えば「いかなる翻訳にも完璧なものは存在しない」という成句なのですが、その理由については、概ね、次の箇条に述べたような主張が目立ちます。
文化的差異
言語は、使用される共同体の文化と強く結びついています。ある言語での表現が別の言語では異なるという文化的背景を持つことが多いものです。これにより、翻訳時にこういった意味の差を埋めて伝えることが難しくなるという主張が散見されます。語彙の違い
言語には、その言語特有の語彙があり、一部の単語やフレーズは他の言語に直接対応するものが存在しないものです。日本語の「いただきます」がフランス語で "Bon appétit." と訳されてしまうように、また「おはようございます」が、スペイン語で "Buenos dias." と訳されてしまうように、特定の感情や概念を正確に翻訳することが困難になるという主張です。文法構造の違い
言語ごとに文法構造が異なるため、原文の意味を維持しつつ、適切な文法に従った翻訳を行うことが難しいという主張です。「英語と日本語は鏡像の関係にある」という言葉を聞いたことのある人は多いでしょう。多義性と曖昧さ
言語には多義性や曖昧さが含まれていることが多く、ある言語の単語や表現が複数の意味を持つ場合、それを他の言語に正確に翻訳することが難しくなるという主張です(筆者の立場は「語に多義があるのではなく、多様な語法がある」というものですが、それはこの場では述べません)文脈の違い
翻訳では文脈を考慮することが重要です。ところが、言語や文化によって(その話者の経験とも言い換えられる)文脈が異なるため、原文の意図や意味を正確に伝えることが難しくなるのが基本です。言語の進化と変化
言語は時間と共に変化を繰り返してきました。今では肯定的な意味となっている "nice" という語が、以前は否定的な意味で使用されていたように、古いテキストを現代の言語に翻訳する際に、元の意味を正確に再現することが困難であるという主張です。感情や比喩の翻訳
感情表現や比喩表現は、言語ごとに異なる方法で伝えられることが多いのが通常です。例えば、"cool as a cucumber" といったイディオムを「キュウリのように冷たい」と和訳しても、何を伝えたかったのかが不明瞭です。こういった表現を他の言語にそのまま翻訳することは難しいという主張です。
以上、つらつらと述べましたが、これらは何も翻訳に限った話ではありません。日本語話者と日本語話者でのやり取り、英語話者と英語話者でのやり取りでも生じる「歪み」です。
この歪みは、筆者なりの仮説なのですが、言語を発する時点で生じます。言葉にならない何かを抱えた経験が誰しもあるかと思いますが、そういった何かを言語として "encode" する時点で、100%の言語化は不可能であるという考えです。
さらに、そうして生成された言語を "decode" する側にも歪みが生じます。上の箇条に挙げたような話し手(addresser)の意図は、受け取り手(addressee)には分かりません。
「誤解」という現象は、このように2段階の「歪み」によって生じていることが理由の一つとして挙げられます。
これが翻訳の場合「英語→英語→日本語→日本語」4段階の「歪み」が生じることになります。つまり、英語で発信された内容を英語で理解し、日本語によって発信し直された内容を日本語で理解するという工程があるからです。
こういった複雑で動的な言語能力は、人工知能における単なるコロケーションによる置き換えでは説明できません。科学の進展により最適化され、以前よりも違和感に気付かないほどにまで精度は増しました。しかし、それが原文の意図までをも汲めているのかどうかという問題までを解決できているとは考えられません。
この件は、大規模言語モデルの学習に使われたデータの出典やアルゴリズムを組んだ開発者の翻訳能力なども関わっています。筆者が未だに人工知能の活用にまで興味を示せない理由は、以上に述べた見解が脳裏に住み着いているためです。
詩の読み方について
こうした背景があるため、文学作品は、文法や時代背景から逸脱しないことを原則に読めば、あとはどういう受け取り方をしても問題ありません。正確に読むことは限りなく難しいため、あなたはそう感じたのですね、といった具合で自由に読めば良いです。
ただし、文法から逸脱しなければ問題ないと言っても、必ず前から順番に読むことを心がけます。It … that といった構文や関係代名詞節などによって、一文が複数行に分かれている場合であっても、必ず前の行を訳し切ってから次の行に進む必要があります(どうしても無理な場合もあります)
物語や詩を書いたことのある人であれば想像に容易いかもしれませんが、普通、作者が読ませたい順番に単語が配置されるものです。門外漢が言うのも憚られますがこれが著名な翻訳者でも守られていない様子で、誤訳の原因を生み出しているのはないかと邪推しています。
以上のことに注意して、詩を読んでみましょう。
"On The Sea" を読む
J. キーツは、結核により25歳で逝去した、イギリス・ロマン派の詩人です。
ロマン主義の詩人の多くは "the burthen of the mystery" という課題に取り組んでいたとされています。これを直訳すると「神秘の負荷」ですが、これは「自分自身で書いた詩をどう説明するのか」という心理的な負荷です。
より具体的に言うと、ロマン主義の詩人は、自然や人生の謎と、それに伴う感情的な重みを抱えており、それを相手にどう伝えるのかという悩みを抱えていました。
ロマン主義の前身は「形式主義」といわれており、文字通り、どういった語で韻を踏んでいるか、弱強五歩格に則しているか、といった形式としての詩の完成度に着目していました。
キーツがロマン主義の詩人として評価されているのは、こういった詩としての完成度だけでなく、こうした感性の鋭さや自然の美しさを巧みに言語化したことによるものであると筆者は考えています。
前置きが長くなりましたが、以下が本日の教材です。
岩波文庫(赤)による翻訳も付しておきます。参考にしてみてください。解説を読む前に違和感のある箇所に気付けた人は、とても英語力のある人ですね。
まず、この詩は、うっかり読み進めてしまうと翻訳に致命的な欠陥が生まれてしまいます。それは、最初の行と最後の行で対比構造になっている点です。whisperings と quired の語が対比の関係になっているため、意識して起承転結を反映する必要があります。
また、文の途中にもかかわらず大文字で始まる単語があります。それは何か特別な意味合いが込められていることに気を付けなければなりません。
さらに、⑨で登場する ye(you)は誰に語りかけているのかという点も理解する必要があるでしょう。
最後に、使用される単語に "seven deadly sins"(七つの大罪)の内の "gluttony"(暴食)に関連する語が散りばめられています。見落としがなければ、③の "Gluts"、⑪の "Feast"、⑫の "fed" です。
さて、詩としての受け取り方は自由ですが、いくつか読み間違えているのではないかと思しき点を引きながら論を進めてみます。
①~②の文です。いきなりですが「荒れ寂びた岸」というのは、少々違和感を抱きます。通常、人間が住めるとは思えない岸に元々誰かが住んでいたのではないかと勘ぐってしまいます。ここの訳は「人のいない岸」という程度に留めておく方が良いと考えています。
また、原文は "It keeps…" で始まっています。一方、翻訳文では「それは…」という語が文の後方に移動してしまっており、二行目の "Desolate" の語から訳を始めています。この点は改める方が良いように感じました。
あえて "It" を書いている以上、この It は大切な語です。省略をしないよう注意します。
ChatGPT は三行で返してきました。不要な接続詞表現が追加され、現代の日本語の調で書かれています。前後の文に関連性がなく「ちぐはぐ」な印象を与えます。ここは、この詩の世界観を決める大切な冒頭であるため、情景をイメージできるように翻訳する必要があります。
④の文で登場する "old" は「古来の」という意味よりも「元々の」という意味の方が座りが良いと思います。「静」に対する「動」の意図を汲むためです。
また、"shadowy sound" の翻訳も大袈裟な印象を受けました。「くぐもるどよめき」ではなく「ざわめき」程度に抑えるのが妥当のように思います。なお、"Hecate" は、冥界を統治する女神です。別名を "Phoebe"、"Diana" として登場することもありますが、ここでは、潮の干満を司る女神として扱われています。
この Of は③の the spell にかかっています。押韻のために改行しています。 the spell of Hecate なので、訳としては誤っていませんが、意味を汲めていないように見受けられます。
また、宮崎訳と同様に "old" を訳しています。「影の響き」という訳は中々素敵な訳ですが、これも少し詩的が過ぎた表現のように思います。ただ、ここが翻訳の難しいところなのですが、Keats が「伝える意図」を持っているのか否かによって意見が分かれるところかもしれません。専門家に意見を訊いてみたいものですね。
⑤ の "it" は、宮崎訳では「それはいとも機嫌おだやかに見受けられ」となっています。ということは、この "it" を「海」と捉えているようです。差し出がましいですが、これは看過できません。
ここで登場する "it" は、'tis と省略されています。この詩における「海」は、物語の舞台ともなっていることから「意味のある it」です。つまるところ、海として捉えるのであれば、この "it" は省略してはならないはずです。
ChatGPT は、形式的なものとして "it" を処理しています。しかし、この行を「文」として扱っているからか、形式的な正確性が目立ちます。
決して悪い翻訳ではありません。人工知能の進化を実感しています。しかし、詩的なリズムや一体感を失っているように感じたので、次のような翻訳を提案します。
と、色々と好き勝手に書いてみましたが、ここまで書いたところで約7,000字に到達していました。途中ですがここまでにしておきましょう(疲れた)
皆さんの翻訳はどうでしょうか。是非、読ませてもらえると嬉しいです。
人工知能との付き合い方
人工知能の登場により「~しなくて済む」という考えが前より増して声高に強調されるようになった気がします。証拠が何かあるというわけではありませんが、そんな気にさせる材料が山ほどあります。今回紹介した「翻訳」のみに留まることを知りません。
しかし、今回の例のように「知識を深めた上で使用する」か「知識を深める段階では注意を払って使用する」ことが望ましいと主張します。
いずれにせよ、これは人間を相手にコミュニケーションを取る時と同じです。相手の言うことを鵜呑みにし、自分の頭で考えないことは不幸を生み出します。もちろん、この記事も例に漏れません。
人工知能は、"artificial intelligence" という英語を当てはめます。この "intelligence" という語は「知能」という訳語だけでなく「情報」という訳を当てはめられる時もあります(例えば「中央情報局」を意味する "CIA" の "I" がそれに該当します)
したがって、知能として依存するのではなく、一つの情報として参考にする使い方を心がける必要があります。人工知能の「民主化」ではなく「大衆化」の始まりとならないよう、自身の芯を太くしておくことです(冒頭でも述べましたが、他人を変えようと東奔西走するのも不幸の始まりです)
この記事がどれほど筆者の考えを「言語化(encode)」しているのか、また、受け取り手がどれほど筆者の考えを「言語化(decode)」してくれるのかは自信がありませんが、何か皆さんの刺激になったのであれば幸いです。
結
とりとめのない話でしたが、ここまで読んでいただきありがとうございました。テクノロジーとして、人間の認知との対比としては AI に関心がある一方、その活用に関心が持てないことについて、ずっとモヤモヤを抱えていたので、この機に整理できて良かったです。
こんなことを書いている暇があったら(自分のために)技術書の一冊でも読んでいれば良いものですが、失意の底に落ち込み切っている筆者にとって「書くこと」や「知ってもらうこと」は心理療法的な効果があります。
繰り返しにはなりますが、人工知能を使役する人の規制は(よほど悪質なものでもない限り)不可能です。したがって、他人をどうにかすることを考えるよりも、自分自身が人工知能との付き合い方を心得ておく方が建設的であると考えています。
しかし、ここに書いた筆者の思いは、この文明の利器に使役されてしまう側の人の元には届かないものです。したがって、筆者には他者を改心させる意志はありませんし、支持を得ようと野心を燃やしているわけでもありません。
一瞬で何かしらの回答が得られるのは魅力なのかもしれませんが、何かを失った気分にもさせられます。筆者は、わざわざ考え込んで凝った訳を案出する方が楽しいです(たぶん目的が違いますね)
ということで、8,000字に到達しそうなのでここで〆ます。また何かモヤモヤした気持ちが生まれたら note を活用する予定です。
それでは。
この記事が気に入ったらサポートをしてみませんか?