字幕の基準作成

※本記事は、kurzgesagtの字幕を一緒に作っているメンバーとともに、字幕を作る際の基準を作っていくための記事です。内輪向けですね。

TEDの日本語字幕について、表記ガイドラインがあったので、それを参照しつつも、Kurzgesagt向けに考えられるといいかと思います。

たたき台(2022/3/20時点)


①秒間文字数は4~6文字/秒を目標に

映画の字幕についてみると、秒間4文字が許容ラインらしい。
ただ、映画と違ってkurzgesagtの動画はしゃべりっぱなしだし、専門用語で文字数が嵩むこともある。4文字/秒をオーバーするのもやむをえないと考える。

TEDの字幕作成班は10文字/秒を上限としているらしい。ただ、TEDは映像を無視して字幕だけを追うことが概ね可能だろう。Kurzgesagtとは事情が違うように思える。
個人的には、動画を視聴していて、「読み終わる前に切り替わってしまった」となるのは7文字/秒ぐらいからである。4文字/秒を目標に、6文字/秒まで許容、7文字/秒を超えそうなら英知を結集する、というラインを提案する。

以前に動画の一部から集計した、私の秒間文字数は以下の図の通り。

グラフは上記記事より。

②改行は1度まで、1行は25文字まで、意味的なまとまりを切らずに

1行の文字数が長すぎると、意図しない改行が生じて見栄えが悪くなるし、一つの単語が行をまたいでしまうと読みづらい。

TEDの字幕作成班は1行あたり21文字までとしているらしい。だがここは、意図しない改行の発生条件に合わせるのがいいだろう。
過去字幕をチェックすると、結果は以下の通りだった
・字幕サイズ100%:37文字でも改行せず
・字幕サイズ150%:30文字を超えると改行
・字幕サイズ200%:25文字を超えると改行

字幕サイズ300%にするユーザーはきっと小数だろうから、25文字を目安にするといいのではないか。

文字サイズを200%に設定すると25文字で改行される。

また、上の例では、ソーセージという単語を跨いでの改行が行われている。だったら「豚バラ」の後で改行をしたほうが読みやすい。

③句点(。)は入れない、読点(、)は入れるが、改行する場合には不要

最近の自分の傾向にすぎないのだが、句点(。)は最近使っていない。
読点(、)については必要なだけ入れればいい。ただし、改行を行う場合には、それがリズムを作るので不要である。

読点が要らない例
エサづくりのための水を計算に入れるなら、
肉や酪農製品のために世界の淡水の27%が利用されている
(これは1行目の最後の読点が不要)

④字幕開始タイミング

発話に合わせて更新する。ピリオドやカンマの後。
こうすると、視聴者がある程度字幕の切り替わるタイミングを予測でき、「唐突に字幕が切り替わった」という感触を与えずに済む。

ただし、ピリオドやカンマがあるからと言って、字幕の区切りにしなくてはならないわけでもない。

なお、動画開始時の最初の字幕は、ゼロ秒から開始してきたが、今後は最初のしゃべりだしと同時にスタートすることにする。これは、視聴者が日本語字幕を出すために設定をいじるための猶予を与えるためで、そうしないと、最初の字幕が読み込まれなくなってしまうらしい。

⑤意訳の方針

テスト問題とは違い、文法に忠実に訳すよりも、視聴者の視聴体験を向上させることが優先される。そのため、以下の要素を考慮した意訳は大いに推奨される。

視聴体験を向上させる条件
・字幕の文字数を削減し、映像に目線を送る余裕を生む。
・専門的な内容も、突っかからずに理解ができる。
・Kurzgesagt側のトーン・テンションが伝わる。(ふざけている、真摯に訴えている)

逆に、文字数削減やわかりやすさのためとはいえ、Kurzgesagt側の意図やニュアンスを捻じ曲げるのはやりすぎとなる。

ニュアンスを曲げずに短くわかりやすくが理想だ。

⑥文意が取れない時は

英文を読んだり、DeepLにかけても文意が取れない場合がある。その場合、以下の手段が助けになる。

・気づけば文字ばかり見ていることがある。映像をよく見る。
・動画詳細欄にあるsourceドキュメントを参照する。記述の根拠が引用されていたりするため、意味がとれることが多い。
・他の言語の字幕が先んじてついている場合、そちらを日本語に翻訳してみると、裏付けになりうる。

それでも文意が取れない場合は、メンバーにその悩みを共有するとよい。(最後まで終わった段階で、特に注釈なく「チェックお願いします。」と共有されても、見落としをしてしまう可能性がある。)

⑦専門用語をどう表現するか

専門用語の字幕中の表記について、まずはweblio等で、次にgoogleで検索をかけ、信頼できる媒体で、その用語の一般的な訳を探す。

cinii等でその用語で検索をかけることも、学術的にどう訳されているかを見出す助けになる場合がある。

⑧文字数削減のテクニック集(提案求む)

例えば「when you eat foods,」を「あなたが食べ物を食べるとき、」と訳しているようでは文字数が多くなりすぎる。自分なら「食事の際」などと訳す。

主語の省略


他言語と異なり、日本語の会話では主語が度々省略される。weなどの主語について、省略しても問題なく伝わるなら、省略してよい。

接続詞の省略


例えば2つの文がbutなど逆説で繋がっている場合、2文目の冒頭を「しかし、」で始めるよりも、1文目の末尾を「が」としたほうが短くなる。

before: 「~~なのだ」「しかし、~~である」
after :「~~なのだが」「~~である」

同様に、soなど順接で繋がっている場合も前文の語尾調整で省略可能だ。

before: 「~~なのだ」「だから、~~である」
after :「~~なので」「~~である」

冗長な表現に注意する


例えば「~すること」「~ということ」「~になること」などと訳している場合は要注意。名詞化による文字数削減の余地がある可能性が高い。

「適度に運動することは」→「適度な運動は」
「健康を大事にするということは」→「健康面の重視は」
「高度になることは」→「高度化は」

などなど、ひらがなが連続している表現には短縮の余地があることが多い。

また、Kurzgesagt側が、専門用語をあえて迂遠に表現している場合もある。文字数が厳しい場合は、専門用語をダイレクトにつかうことで、大幅な短縮も可能となる。以下の記事から実例を挙げる。

It takes the asteroid only two seconds to pass through the thin layer between space and the ground to make contact.

ここの "thin layer between space and the ground" を「宇宙空間と地面との間にある薄い層」と素直に訳してしまっては、文字数が爆発してしまう。

この言い回しを見て思ったのは、一単語で表現できるものをあえて文章化しているパターンではないかということだった。例えばお茶を「熱くて苦い緑色の液体」と表現するようなパターンだ。

そこで、sourceドキュメントをみると、これは「成層圏」の迂遠表現だった。文字数の都合で、ここは遠慮なく成層圏と訳した。

⑨単位の換算など

例えばドルやユーロなどは、円に換算しなくてよい。レートの変動もあるし、視聴者にもある程度量的な把握が可能なためである。

ヤード・ポンド法などは、あまり登場した記憶もないが、今後必要に応じて協議する。

⑩映像と字幕との同期について(20220416追記)

動画内で複数の項目を列挙するときの注意点について、問題提起があった。例えば、この動画の10:30からのテキストと、その訳は以下の通り。

we need much better infrastructure, agriculture and cities.
また、インフラ、農業、街づくりを改善する必要がある。

We WILL Fix Climate Change!
10:30より

別にこの訳は悪くないのだが、実際に映像を見ていると、「infrastructure, agriculture and cities.」のところで、イラストがコマ割りのように重ねられていく。

infrastructure, agriculture and cities.と発音されるたびにイラストが重なっていく

このような場面では、視聴者は映像に合わせて字幕を読んでいくことになる。つまり「we need much better infrastructure, agriculture and cities.」と全文を読み上げた時点で、「また、インフラ、農業、街づくりを改善する必要がある。」の太字部分までしか、目で終えていないというのだ。

ここから1秒も経たないうちに次のテキストのナレーションが始まり、字幕も切り替わることになる。後段の「を改善する必要がある。」を読み終える時間がないのだという。

つまり、字幕を作る上で、秒間文字数や文意の正確さ、直観的なわかりやすさなど以外にも、映像との同期が必要な場合があるということである。

あまり語順を縛っていると、訳し方の幅が狭くなって厳しいとも思うが、映像との同期がとれていないと読みづらいケースは実在するので、押さえておく必要がある。

⑪視聴者が突っかからないか。

食欲が暴走し、フードカップが1ダースも作られる
巨大で不気味な、口のような吸盤だ

上記の例では、フードカップという未知の語がまず出てきて、それが何なのかの説明が後にくる構造になっている。これは、字幕と映像を同時に、忙しく解釈している視聴者にとって、ストレス要因となりうる。

その間もアメーバは増殖し、戦い続け
あなたの脳に齧り付いていく

こちらの例では、「齧り」がそもそも読みづらい。漢字としても難し目だし、画数が多いので画面サイズ次第ではけっこう潰れてしまう。なるべく平易な漢字、平易な単語を用いていくことも、また秘訣なのだろう。

また、ひらがなである方が自然な言葉については、文字数を削減できるとしてもひらがなとする。例えば「そのため」を「その為」とか「其の為」としない。そのほうが視聴者にとってスムーズだろう。

以上のように、視聴者目線では意外とストレスの源になるポイントは多くありそうだ。いくつかのルールを抑えておくと同時に、ここは相互チェックの力が発揮されるポイントだろう。

字幕のメイン担当者は、もはや純粋な視聴者目線になることは難しい。苦労して決めた翻訳であるほど、ニュアンスが自分のものになってしまっている。その読みづらさに気づくことは難しいのだ。

⑫動画のカットにご注意

何度かあった話。動画内の宣伝パートが投稿からしばらくしてカットされることがある。

「72時間限定販売のグッズ」などの告知は要注意で、それも含めて字幕を作り、投稿したら、告知部分がカットされることがある。

すると、SRTファイルは単に動画内時間を指定してそこに文章を出すだけなので、字幕と映像がズレてしまう。

動画の冒頭に告知が来ていたケースでは、動画の全ての時間で字幕ズレが起きてしまい、悲しい感じになってしまった。

回避方法:字幕投稿直前に該当の動画の再生時間を確認する。字幕作成のためにDLした動画の再生時間と一致するなら大丈夫。一致しないなら、どこがカットされたのかを突きとめ、字幕を修正してから投稿する。

テンションが高いときは、動画投稿からなるべく早くに投稿しようとしてしまうが、冒頭に告知が入っていたり、期間限定商品に言及したりしていたら、字幕投稿まで10日は待って再生時間を確認すべし。