翻訳者のための実体参照入門
こんにちは、川津です。
今回は「実体参照」について軽くご紹介しようと思います。
実務翻訳に興味のある方のうち、この言葉をあまり聞いたことがない方を対象とした内容です。
「実体参照」という言葉自体は、検索すればいくらでも解説記事が見つかります。ただ、そのほとんどが網羅的な内容です。作業中に調べものをするならともかく、事前に「実体参照ってどういうもの?」と調べたい人にとっては少し情報過多かもしれません。
そこで今回は、翻訳業務で頻出するものだけを数個選び、翻訳時の注意点と併せてご説明します。
実体参照とは?
簡単に言えば、「そのまま記述してしまうと、システムの都合上別の意味で解釈されてしまうので、特定の文字列によって文字や記号を言い換えたもの」です。
たとえば、「¥」という記号は「¥」で表すことができ、「&」という記号は「&」で表すことができます。
(参考ページ:https://ja.wikipedia.org/wiki/文字参照)
あまりなじみのない表記方法ですね。ですが、翻訳支援ツールで作業をしたことがある方の場合、ひょっとしたら既に出会っているかもしれません。読み飛ばしてしまった謎の文字列、またはタグのようなものとして。
補足説明:タグとは?
(知っている方は、読まずに次の「ノーブレークスペース」のセクションにお進みください!)
タグというのは、一言で説明してしまえば「マークアップ言語の命令文」なのですが、具体的には以下の太字部分のようなものです。
そして、今回のテーマである実体参照も、翻訳支援ツール上で同じく<>で囲まれ、タグのように表示される場合があります。
一旦例文を見てみましょう。こんな文があるとします。
「2021年の感謝祭は11月25日です」という意味のシンプルな英文です。< >が半角スペースの役割を果たしているため、onとNovemberの間に普通の半角スペースがないことにお気づきでしょうか。実際の表示は以下のとおりです。
さて翻訳支援ツールでは、タグの表示を縮小表示できることがほとんどです。特にOffice文書をバイリンガルファイルに変換したときなどは、長大な複合タグが出現しがちなため、縮小表示したまま作業することもあるかもしれません。そんなとき、たとえばタグの番号(セグメント内の出現順に振られる番号)だけが表示されるモードだと、上記の例文はこう見えます。
特にこういう表示にしているとき、実体参照を見落とすことがありますので、あらかじめ知っていればそのような事態を防ぐことができます。
ここからは、特に翻訳業務において頻出する実体参照を具体的にご紹介します。
ノーブレークスペース「 」
先ほどの例文にも登場させましたが、これが筆頭と言って過言ではないと思います。
普通の半角スペースであれば、翻訳支援ツール上で実体参照されることはありません。ところがノーブレークスペース(改行禁止スペース)は、実際には半角スペースとして表示されるにも関わらず、実体参照されてタグの羅列に紛れ込むことがあります。
スタイル指示を順守するため、特に注意せねばならない記号です。
もう一度、同じ例文を見てみましょう。
これを翻訳するときにやってしまいがちなのが、次のような処理です。
このとき、実際の表示はこうなります。
これは要修正となります。
というのも、ほとんどの場合、スペースの有無はクライアントからの指定に従って統一する必要があるからです。この文では「2021年」や「11月25日」から分かるように、半角数字と全角文字の間にスペースは不要です。それなのに< >、つまり半角スペースを入れてしまっては、処理が不統一になってしまいます。このような場合、< >は削除します。
(これらは「翻訳支援ツールによってタグのように扱われている」だけで、実際のタグ(命令文)ではないため、特段の指示がなく、かつ日本語訳文において不必要であれば、削除して構いません。実体参照タグの削除に不安や懸念がある場合は、発注元の担当者に確認を取ってください)
アンパサンド「&」
「&」の記号です。これは翻訳支援ツール上で実体参照になっていても、あまり見落とすことはありません。ミスが発生するとすれば、固有名詞において「アンド」とカタカナにするべきところで、タグ形式のまま残してしまわないようにするくらいでしょうか。たとえば、以下のような場合です。
また、どういうわけか、他のタグは存在しているのに「&」などの一部の実体参照がベタ打ちで表示される場合もあります。そんなときも、慌てずに「&」に読み替えればいいだけです。
小なり記号「<」、大なり記号「>」
「<」の記号は「<」で表され、「>」の記号は「>」で表されます。
これらの実体参照は< >や<&>ほど頻繁に出会うことはありません。
ではなぜ入門編の記事で紹介するのかというと、過去にこういうパターンを見たことがあるからです。
もはやしっちゃかめっちゃかですが、例文自体は先ほどと全く同じです。さっきタグ化されていた< >、<b>、</b>のそれぞれの括弧が、さらに<<>と<>>に置き換えられてしまっています。
どうしてこうなったのかまでは把握できていませんが、こんなケースもまれにありますので、タグの数がやけに多いファイルに遭遇したときは、一旦<<>と<>>がないか確認するようにしています。
(ただし、誰がどう見ても作業が不可能なほどタグが多い場合は、翻訳ファイルの前処理がうまくいっていない可能性もあるため、一度問い合わせてみることも有効です)
まとめ
以上、「 」、「&」、「<」、「>」を例にとってご紹介しました。
ところで、こんなに実体参照の種類があると、「新しい種類の実体参照が出てきたら見落としてしまうかも」と不安になる方もいらっしゃるかもしれません。
ですが、心配はご無用です。実体参照は必ず――私もそこまで詳しくないので断言してよいかわからないのですが、しかし翻訳業務で通常遭遇する範囲であれば必ず――アンパサンドとセミコロンで挟まれています。
ですので、何か意味のわからない文字列が「&」と「;」に挟まれて出てきたり、それがタグ化されたりしていたら、何の記号/文字なのか調べてみてください。おそらく、よく知っている記号や文字が大半です。
また、その文字列をファイル内検索してしまえば、たとえば削除するべきだった記号をうっかり残していても、一括置換で対応できます。見落としてもリカバリーしやすいということです。
ですので、分水嶺はただひとつ、「実体参照を知っていて、それがファイル内に存在すると気づけるかどうか」。それさえできていれば、何も心配はありません。
この記事が気に入ったらサポートをしてみませんか?