Clipchampの中国語合成音声を使ってミニ教材を作る

ChatGPTに台詞を書かせ、Clipchampに合成音声で読み上げさせる

ChatGPT(GPT4o)にある中国語の成語をテーマに、職場での会話という指定で会話文と、選択式の聞きとり問題を出力させました。また、ChatGPTで会話に合わせて1枚の絵を出力させました。
次にClipchampという動画編集サービスで合成音声で台詞を読み上げさせて、動画として出力しました。
まず作例を見て下さい。ChatGPT+Clipchampで作成した動画に説明も入れてブログの記事にしてあります。

作例1

作例2

Clipchampについて

ClipchampはWebブラウザで使う動画編集サービスです。大阪大学の岩居弘樹先生に教えていただきました。岩居先生のセミナーに出た当時はClipchampはベンチャー企業でしたが、その後Microsoftの傘下に入りました。

Clipchampには無料アカウントと有料アカウントがあります。Clipchampの無料アカウントと有料カウントの機能差については以下のページを見て下さい。
私は今のところ無料アカウントの範囲でやってます。

Clipchampは今はMicrosoft365の中にも入っているので、勤務先がMicrosoft365と契約している方はそちらで使った方が便利かもしれません。

Clipchampの合成音声

ClipchampはMicrosoftが持っている多くの言語の多くの合成音声が使えます。
「録画と作成」→「音声変換」で音声合成のモードに入ります。

Clipchampの操作画面

もちろん中国語もたくさんの声があります。普通话はもちろんのこと、台灣華語、広東語もあります。方言の影響を受けた普通话も複数の地域のものがあります。

Clipchampの音声変換の「言語設定」

Xiaoで始まる音声は女声、Yunで始まる音声は男声です。
Multilingualという注釈がある声は、台詞を分ける必要はありますが、同じ1つの声で複数の言語の読み上げが可能です。

詳細設定というところを開けると、速度調整や声の高さの調整ができます。
また、一部の声は、快活、不満、悲しみ等の感情を声に乗せることが可能です。

Clipchampの音声変換の「詳細設定」

Clipchampはそもそもは動画編集サービスですから、合成音声も台詞ごとにタイムラインを持っています。ですので、台詞と台詞の間隔を自由に調節することができます。いわゆる台詞の「かぶり」(前の台詞が終わりきらないうちに次の台詞が始める)も可能です。

Clipchampのタイムライン

Clipchampのコンテンツライブラリに中には、無料で使える音楽や効果音などがあり、相当凝ったものも作れます。
ただ、動画作成や動画編集はやればやるほど「深みにハマる沼」なので、上記の作例の中にある動画は、静止画と合成音声でできた1分ほどの短いものです。作例2では1箇所だけ効果音でスティンガーを入れました。
いずれもClipchampからエクスポートした時点で、動画は1本あたり6MBほどでした。さらにHandBrakeという動画圧縮ソフトを使ってWeb用に最適化して圧縮すると2MBくらいになりました。軽いですね。

オタクな中国語教員。日本語母語話者向けの中国語初級教材をPDFとEPUBで作っています。