見出し画像

ChatGPTで実践、シンプル文体への翻訳

ポイント

  1. ChatGPTを使えば、翻訳文をわかりやすい文体に直すこともできる。

  2. その際は、翻訳とリライトの2ステップに分割して作業するのがよい。

  3. 「簡単にわかるようにリライトして」と頼めば、かなりわかりやすくなる!(ただし正確さのチェックは必須)

はじめに

これまでの機械翻訳にはないChatGPTの強みのひとつ。
それは1から文章を生成することもできる点です。

原文ありきの訳文を出力するだけでなく、やろうと思えばそれをもとに文章のスタイルだけを変えたり全く別の内容に書き換えることさえ可能なのは、これまでの機械翻訳ツールにはなかった強みといえます。

たとえば「ChatGPT Prompt Engineering」のDiscordサーバーには、内容をシンプルにわかりやすくするためのプロンプトが紹介されています。
https://discord.com/channels/1051259432199266374/1066525178647027742/1066525178647027742

Voice and style guide: Write at a 5th grade level. Use clear and simple language, even when explaining complex topics. Bias toward short sentences. Avoid jargon and acronyms

上記のプロンプトは、小学校5年生にわかるレベルの、単純な語彙と短い文章を使い、専門用語や略語を使わないようにして文章を書け、と指示するためのプロンプトです。

これは1から文章を生成するためのものですが……。

これを翻訳に応用すればどうなるのか
もしかすると、非常に複雑で専門的な内容をわかりやすく翻訳できるのではないか?

結論から言えば、結構できてしまいます。ということで……。

実験してみました

専門的な文章ときて、まず思いついたのは科学論文。arxivから量子力学の論文を(https://arxiv.org/abs/2304.01256)見つけてきて、概要部分を訳させてみます。

今回使用したのはGPT-4モデル。さすがに進化版だけあって、日本語の言葉遣い、訳文の自然さは目に見えてレベルアップしています。

翻訳と文体の指定を同時にやると、この通り、専門用語が頻出する難解な文章のまま。少なくとも小学5年生が読んでわかる文章ではありません。

そこで操作を2段階に分割します。
まずは英文和訳。この段階では原文に忠実な逐語訳に近い訳で十分なので、プロンプトにもそう明記してみます。すると……。


出てくるのは先ほどと変わらない、専門的で難解な文章。

ここからはリライトにかかりましょう。冒頭で紹介したかんたん文書スタイルガイドを少し書き換え、文章をリライトさせるためのプロンプトを入力すると……。


何となく、ごくう~っすらとですが、言っていることが飲み込めるような気がします!
少なくとも専門用語を噛み砕いてくれたおかげで、情報が動くのに伴って起きる変化についての研究であること、その変化にある程度の共通性があること、ゆくゆくは情報の動きについて理解を深められそうなこと……。
本当におおまかな概要だけですが、なんだかわかったような気はします

ただ、あちこちで言われているように、ChatGPTは嘘つきの名人
ここでやったのは、元々ある文章をいわば要約する作業に近いものですが、それでも100%正確とは限りません

ざっくりした理解で問題ない場合はいいのですが、そうでない場合には十分注意してください。

プロンプト

最後に、今回使った「シンプルな言葉で翻訳をさせる」ためのプロンプトを書いておきましょう。
プロンプトの入力は2段階。まずは以下のプロンプトの[]内を書き換え、訳させたい文章と一緒に入力します。

以下の文章は、[入力する文章の概要]です。
文章の意味を大きく変えることをせず、また、下記で指定した文体とスタイルに従った上で日本語に翻訳しなさい。
[以下、訳させたい文章]

次に、出力される訳文をコピーし、以下のプロンプトと一緒に入力しましょう。

""" """で囲った以下の文章を、下記で指定した文体とスタイルに従った上でリライトしてください。
文体とスタイル:文章は小学5年生に理解できるレベルの語彙で構成された文章。複雑なトピックを説明する時でも、明瞭でシンプルな語彙を使うこと。あまり長い文章は書かない。専門用語や略語は避けること。
文章:"""[出力された訳文]"""

実作業に、あるいはプロンプトの参考や研究などにぜひご活用ください。

この記事が気に入ったらサポートをしてみませんか?