見出し画像

同時通訳と文字起こしで『WHO YOU ARE』をちゃんと訳せるのか?

シリコンバレーのすごい起業家、ベン・ホロウィッツ の新刊『WHO YOU ARE』を新しいやり方で翻訳しようというチャレンジをすることになった。普通は本の翻訳は、原書を読みつつ翻訳家が調べ物をしながら、コツコツと訳していく。担当編集者の中川さんによると、早い人でも1冊訳すのに2カ月、時には半年から1年以上もかかる場合もあるそうだ。それを今回は、私の同時通訳のスキルを生かして、音声版の本を聞きながら訳してテキストをつくり、その後に関さんが翻訳原稿を整えて時間を短縮しようという驚きの試みだ(詳しくは第一回のこちら「発展途上の起業家が『WHO YOU ARE』を訳した理由」)。

まずはAudibleで聞きながら同時通訳で日本語テキストをつくる

新規事業やプロトタイピング大好き人間の私としては、ゼロの状態が一番楽しい。早速アマゾンのAudible版の原書を購入し、イヤホンをつけ、書籍冒頭にあるベンのイントロダクション部分で練習してみようと試してみた。文字起こしツールとしてすぐに思いついたのはGoogle Docsでできる音声入力機能だった。PCで白紙Google Docsを開き、マイクボタンをクリック、文字起こし機能開始。音声はスマホにいれたAudibleアプリなのでPCとは独立している。きれいな英語音声が流れ始めた。ちなみに原書は手元になかったので、聞こえてくる音声をそのまま初見(?)でしゃべる雑さだ。小さい頃にピアノの楽譜を見ていきなり弾いてみたときの感覚に近い。イントロダクションで語られる言葉はすんなりと頭に入り、喋りだすことができた。

画像3

(ノイズキャンセリング機能で耳栓代わりとして利用したAirPods Pro

しかし、すぐにつまづくことになった。目の前においてあるPCのGoogle Docsの文字起こしのスピードが遅すぎるのだ。耳で聞くと同時にしゃべると同時に文字起こしされる様子を目で追っているのだが、この目の部分が遅い。文字が書き込まれて変換されていく様子をつい目で追って待ってしまう。それによって流れている音声が頭に入ってこなくなる。

人間は自分の話したことを直後に繰り返されると脳がついていかなくなって思考が止まってしまうらしい。誰かがそんな装置を作ってイグ・ノーベル賞を取っていた気がする。(調べたら2012年のおしゃべり妨害装置のことだった)というわけで思考が止まって進まない。たぶん視界に入るのが悪いのだと思い、PCを後ろ向きにして再開した。これはこれでなんだかわからないがやりづらい。入力がされているんだろうな、自分の想定しているスピードでデータは入力されていないんだろうな、という気持ちが走ってしまい、やっぱり集中しづらい。耳でインプット、口でアウトプット、目で監視は不可能と判断した。

Audibleをとめ、原書の文面を目で見ながらそれを同時通訳するようにしてみた。また、Google Docsの文字起こしでは信頼性が足りない&音声ログが残らないので、ここも新しい仕組みを作った。自分の話した音声をまずすべて録音し、そのあとに文字起こしシステムに放りこんでテキスト化するようにした。絶妙なタイミングでアマゾンが文字起こしツールAmazon Transcribeの日本語対応を開始し、AWS上で利用できるように公開していたので早速使ってみた。

アマゾンの文字起こしツールTranscribeは優秀!

whoyouareメイキング挿絵.002

(一度やってみたかった「いらすとや」を使った挿絵解説)

非エンジニアとしてはやったあとに気づくのだが、AWSのアカウントを整えたのち、S3に音声データをアップして、そこからはじめてAmazon Transcribeが使えるようになる。そして出力される文字起こしデータはJSONファイルという、ワードだけで済ませようと思っていた人間としてはなかなか色々やらされたのを覚えている。Alexaアプリを遊びで作ったりするなど、AWSのアカウントも個人用に作っていたので思ったほど苦労はしなかったのが本音。

すると、おもいのほかスムーズに文字起こしができてしまった。しかも音声ファイルも残っている状態。もしかしたら関さんや中川さんの言う通り超スピードで翻訳が完了してしまうかもしれない。しかし、出力した文字起こしファイルは句読点が一切存在せず、また口頭でとちったところや言い直したところも文字起こしされていたり、固有名詞が謎の日本語に変換されていたりするなどあったため、修正作業が必要だった。

ここでは、どのクオリティで関さんにパスをすべきかの期待値コントロールが大事だ。めちゃ雑なものを関さんに渡しても「浅枝さんがなに言ってるかわかんないから結局原書全部読み返した」だと迷惑だし意味がない。関さんが素晴らしい翻訳家だとはもちろんわかっているけども、せめてアマゾンが認識できなかった漢字間違いや正しく認識されなかった固有名詞などは編集したうえで渡すべきかもしれない。


見られるのはここだけ!同時翻訳の文字データと音声

ここに実際の作業の一部を公開しよう。

スクリーンショット 2020-04-20 14.51.11

まず、文字起こしデータのサンプル、というか実データ。具体的には第7章の冒頭部分で、Macのボイスメモアプリを開き、文章を睨みつけながらぼやいていく。この文章量で録音時間11分。この箇所の出だしの一部を改行と句読点処理すると下記のようになる。

wydiwya051

中性心と出力し

現代の企業はうっすらとしたカーストシステムを導入している

あなたの社会的階級はホワイト防音やブラック防音で判断される訳ではないが
ブルーカラーかホワイトからーかまたはスタンフォード大学出身か
ミシガン州立大学出身かなどで階層が決まっていく

シリコンバレーにおいてはコードをかけるかどうかで一般的に判断が行われる

マイクロソフト社のグローバル戦略ヘッドだったバギ見てろたが
二千四年にフロンティアコミュニケーションズの社長に就任した際、
彼女は現代ビジネスに置いてもっとも硬直した階級システムに直面する

アンドの地域分割によってできた通信会社の一つであるフロンティアは
ほとんどの収益を一般電話と長距離電話サービスで稼いでいた。

この会社には二つの従業員の階級ホワイトカラーとブルーカラーが存在した。

「出力し」ってなんだ?「防音ってなんだ?」ちなみに元ネタとなった音声データはこれ。

答えは「実力主義」と「ボーン」だった。音声を聞けば何言っているか多少理解できる。少し安心した。自分で音声を聞き直しながら修正をかけていけばよいのだが、それをすると作業量がまた増えていく。

そんなコミュニケーションをしたところ「一番雑なやつ+音声データで全然OK。めっちゃわかる」と言っていただく。よーし、あとは目で文面を追いながらひたすら独り言をつぶやくだけだ!毎晩夜に数時間ずつやれば2週間くらいで終わるのでは?と思っていた。しかしすぐに、自分がバカだったと気づく。

ハイチの革命、チンギス・ハンの話は突然同時通訳ができない・・・

結論から言うと、Audibleで同時通訳が簡単だったのは、ベン自身の言葉で語られるイントロダクションの部分「だけ」だった。『HARD THINGS』のような、シリコンバレーやスタートアップ業界に則した内容だったならば、見込みもそこまで外れていなかったと思う。

しかし、第1章からいきなり歴史書のような構成となっていたのは誤算だった。歴史背景、地名、人名などの固有名詞が飛び交い、フランス革命と独立前ハイチの関係、独立前のアメリカの歴史などの知識を通訳する私自身が身に着けなければいけなかった。使用される英語のボキャブラリーも日常では使わないような難しいものが多く、初見で勢いで訳せばよいだろうと挑んでも、3秒後には知らない単語に出くわしてしまう。そのたびに言葉に詰まってしまい、とてもじゃないがラフ翻訳とは言えないものになってしまった。

作戦変更をし、原文を一回読んでから訳すことに。それでもやはり難しい。パッと日本語が出てこない単語が多い。もしこれが同時通訳の案件で会場でリアルタイム対応だったとしたら完全にクレーム案件だ。幸い、思考の瞬発力の要求レベルは書籍だから求められないが、今回目指すスピード翻訳にあたってはその瞬発力を適用したい。なので、ベースにしてた原文の横に、難しい単語のところだけWeblioで調べた日本語訳を添えることにした。また、その流れで原文を一回読むことにもなったので文章構成やストーリーの組み立ても理解したうえで挑めるようになった。それでも、定期的にワンセンテンスで5行くらい使うような長文がでてきたときは苦労してしまう。こうした超長文に関してはまるごとテキストで翻訳をするような流れにした。


スクリーンショット 2020-04-20 18.07.58

(単語メモの記録例。一回英語を読み、区切り部分で内容を忘れないようにメモをしている。ピリオドの部分を見るとわかるが、上記英文はなんと5センテンスしかない。)


ワンセンテンスが数行になる箇所は1ページに1回程度と見積もったがこれもまた誤算で、ルーベルチュールとチンギス・ハンの解説の章ではこれらが多く登場し、同時翻訳をするどころか、テキストとにらめっこをして、ワンセンテンスを翻訳するのに5分〜10分かけるような状態になっていた。

しかしきっと翻訳というのはそういうものだ。初見で一気に訳してしまうことが可能だと思うことのほうが間違っていた。プロの仕事をわかっていない典型的な自称中級者のミスをしでかすところだった。

第三回:『WHO YOU ARE』翻訳のHARD THINGSへ


この記事が気に入ったらサポートをしてみませんか?