見出し画像

ChatGPT4を飼い慣らす 30 テープ起こしを、ChatGPT4に滑らかな会話にしてもらう、というタスクが意外なほど出来が良かった。仕事のプロセスが変わるかもしれない

上記はあるインタビューのテープ起こしだ。
固有名詞は仮名にしてある。
ちなみに僕はテープ起こし(録音テープからの文字起こし)は指名した特定のプロに頼んでいるので、正確でミスは少ない、テープ起こしとしては最良のグレードだと思う。
とはいえテープ起こしは、録音されていないことはかけないし、録音されていることは書かなくてはいけない。(ただし僕の場合は特定の人にお願いしているので、余談とか原稿にならないであろう部分、つまりノイズとしての会話は省いてくれているので、そこが素晴らしいし、それはChatGPT4にはできない)
なので以下の文字は話したままの会話だが、それを原稿化するときの労力がけっこうある。これをChatGPT4で「校正しながら自然で躊躇な会話体にして」と頼んでみた。

まずテープ起こしが以下

池谷 小野さんと言えば仕事が早いで有名ですね。

小野 そうです。マイクも一応立っていてメーター振らせているんだけど、ミックスに全然使わないんですよ。ミックスバスから外してある。でも後ろにCMのクライアントがいるから、いっぱい使っているように見せるわけ。テープレコーダーのメーターは振れているんだけど、バスに入っているのは3本だけとかね。そうするとすごい早い仕事をしているように見える。音がまとまるのも早いし。

池谷 小野さんがステレオのレコーディングエンジニアとしてトップだったと思うんですけど、だんだんサラウンドとか、今はもうイマーシヴに進められて、 意外と行っていない人が多いと思うんですよ。2チャンのまま。そうじゃなくてどんどん立体音響に行き、今回もAVアンプに関わられてきた、そのきっかけと言うかどういう方向性でそうなっていったんですか。

小野 一般的に見せた例では、ブルーノートにサンプリングリバーブを天井に持って行って、そうするとリバーブだけ上で、楽器の音は前・・・

池谷 スピーカーを持ち込んだということですか。

小野 そうです。このスピーカーを入れてもらったんです。メーカーの協力もあり、あそこにこれを入れたらすごいねということで。あそこの部屋で一番びっくりしたのは、いつもそこで働いている人たちが、「なんで今日こんな音がなるの?」っていうね。明瞭度は変わらないのにリバーブの部屋になって、しかも曲ごとに変えたりしたから、曲によって広がったり、ホールになったり教会になったり、ドライになったりするっていうね。プログラムを変えながら。しかも演奏しながらそれをやったりとかできるっていうね。本当のホールではできない。そうするとやっぱりリバーブとか響き成分というのは上横で、楽器のダイレクト音とは違う所から来るほうが気持ちいいと同時に、リバーブがかかっていない音が前から来るので、楽器の明瞭度が圧倒的なんですよね。

ChatGPT4による処理後


池谷: 小野さんは仕事が早いと有名ですね。

小野: そうですね。マイクは立っていてメーターも振らせているんですが、実際のミックスにはあまり使いません。ミックスバスから外しています。ただし、CMのクライアントがいるため、多く使用しているように見せています。テープレコーダーのメーターは振っているんですが、実際にバスに入っているのはわずか3本ぐらいですね。そうすると、凄く早い仕事をしているように見えるんです。音がまとまるのも早いですし。

池谷: 小野さんはステレオのレコーディングエンジニアとしてトップだったと思いますが、だんだんサラウンドやイマーシヴなどへ進んでいく中で、まだ2チャンネルのままで進めていない人が多いと感じます。どうしてそうなっていったんですか?AVアンプに関わられたきっかけや方向性など。

小野: 一般的な例を挙げると、ブルーノートのスタジオでサンプリングリバーブを天井に持っていき、リバーブは上部に配置し、楽器の音は前方に配置しました。

池谷: スピーカーを持ち込んだということですね。

小野: はい、そのスピーカーを使いました。メーカーの協力もあり、そこにスピーカーを設置することで効果的なサウンドが得られると分かりました。スタジオで働いているスタッフが驚いたのは、いつものスタジオでなぜ今日こんな音が出るのかということです。明瞭度は変わらないまま、部屋がリバーブに変わり、曲によって広がったりホールになったり教会になったりドライになったりするんです。さらにプログラムを変えながら演奏も行えるんです。本物のホールではできないことですね。この方法により、リバーブや響き成分は上部から来るため、楽器の明瞭度が圧倒的に向上します。

どのように校正したのか、ワードの文書比較機能で調べてみたら、けっこう芸の細かいところをやってくれている。これは、ちょっとたいしたものだと思う。

ワードの校正機能による差分の抽出


さすが、チャットに特化したAIだ。自然な会話にするのは本当に得意なのだろうと思われる。

ただ重要な部分を落としている(類推できていない)部分もある。原文の下記の部分。

しかも曲ごとに変えたりしたから、曲によって広がったり、ホールになったり教会になったり、ドライになったりするっていうね。プログラムを変えながら。

これは残響がないライブハウスなのに、今日は残響がある、しかも音が明瞭である、さらに、曲ごとに残響が変化する、のが凄いといっている。

明瞭度は変わらないまま、部屋がリバーブに変わり、曲によって広がったりホールになったり教会になったりドライになったりするんです。さらにプログラムを変えながら演奏も行えるんです。

そのすごさがどんどん進化しているという部分が出せていない。いや、論理的には出ているのかもしれないが、驚きを伴いながらどんどん進んで行くという序破急的な部分が、口語の原文にはあったが出せていないように思える。

いつも多くの分野においてChatGPTが語られるのと同じ結論だが、非常に便利なツールであり、活用することは大切だが、全面的に頼ってはいけない、と思う。

とはいえ、僕はインタビューの仕事が多いので、これは使えると思う。
いつもはテープ起こしを構成して、原稿に形になってきたところで、文章に手を入れるという流れでやっているが、ChatGPT4でそこそこきれいな原稿に処理できるなら、先に全てのテープ起こしを処理してから、構成して原稿化するのもいいかもしれない。

ChatGPT4の旅はまだ続きます。

ChatGPT4を飼い慣らす、の一覧がこちら。


以下はiPhoneアプリでChatGPTを入れてみた話。
マイクを使った音声入力が凄い話をした。音声入力の精度の高さが凄い。
これがややバズリギミな記事

スマホアプリのもう一つのメリット、カメラについても、こちら。
これは凄いです。OCRがすごい。

その後も淡々と、校正してもらったりしている。
いまのところ僕が最も重宝している使い方がスケジューリングのコパイロットとして使うことだ。


とやってきた。

この記事が気に入ったらサポートをしてみませんか?