見出し画像

合成音声を作ってみよう!〜その1〜

こんにちは。今日はクリスマスイブですね。
みなさんは誰とどこでどう過ごしますか??
恋人と綺麗なイルミネーションを見に行ったり、家族と豪勢な食卓を囲んだり。中にはプレゼントを愛しい我が子の枕元に置くというミッションをこなしているサンタクロースもいることでしょう。もちろん、仕事している立派な社会人だっているハズです。

そういうお前はどうなんだって?
僕は1人で652の文章をひたすら読み上げています。

そんな聖夜あってたまるか。


何をしているかと言うと、自分の声を元にした合成音声を作っているのです。何故かって?面白そうだから、以外にあるわけないだろう。

合成音声(例:ずんだもん、ゆっくり霊夢など)と自分が掛け合いをする動画があったら面白いかなって思ったんですよね。始まりはそれから。
自分は生声でもよかったんですけど、これがなかなか難しい。解説系の動画なら多分いけるんですけど、
生憎、自分が作ってるのはゲームプレイの動画が主なんです。

つまり、刻々と変化するゲームの動画に対して掛け合いをしなければいけないわけですが、これが生声と合成音声とじゃ難しい。
尺が足りないから不自然にならない程度に喋る速さを調節したり、言い回しを変えたり。尺が余った箇所になんてことない雑談を挿し込んだり。
そういうことをするのが生声だとめちゃくちゃ面倒なんですよね。

だから自分、閃きました!自分の声を元にした合成音声を作ってしまえば楽なんじゃない????天才的発想!!!👏👏👏



….というわけで冒頭に戻ります。

今回利用するサービスは、MYCOEIROINK(以下、MYCOEと表記)。

シロワニさん氏により開発されたテキスト読み上げソフトウェアである "COEIROINK"内で利用できる、ユーザーによるCOEIROINK合成音声です。

簡単に言うと、声優やインフルエンサーでなくても、誰でも合成音声を作れるよ!そんな誰かの声を元にした音声ライブラリを誰でも利用できるよ!
そんな感じだと思います。



まずは材料を確認しましょう。

  • 10〜652の文章を読み上げた音声

  • 上記の音声を録音する為の録音ソフト

  • 録音ソフトに入力する為のマイク

  • GoogleDriveに7GB以上空き容量のあるGoogleアカウント

  • 動作を確認する為のCOEIROINK

なるほど。読み上げた文章が多いほど完成度があがるそうなので、652文読み上げることを決意。
そして用意した機材がこちら。
まずはマイク
TASCAM DR-40というボイスレコーダーを用意しました。

TASCAM DR-40
既に生産終了になっていた古代遺物(アーティファクト)。

次に録音ソフト
Audacityというソフトを使用しました。

Audacity

無料ソフトです。
…というか、正直DR-401つで録音ソフトもマイクも事足りているんですが、音声をトリミングしたりボリュームを調整するのにAudacityを使用しています。
ボイスレコーダーをもっていない人は、マイクをPCに繋いでAudacityなどの録音ソフトで収録すればいいと思います。

次に、Googleアカウント
まぁ当然持っているので省略。

そして、COEIROINK
自分自身COEIROINKを使って動画を作っているので、持っています。
持っていない人はコチラへ↓

最後に、自分の声を録音した音声データ。


さて、ここからが本番ですね。

なんたって652の文章を読み上げるわけですから。
……ところでどんな文章を読み上げればいいんだい?
それはMYCOEの手順をしっかり読んでくれ。

ここから僕が書き連ねるのは、作るまでの過程におけるトラブルや感想にとどめておきたいと思っています。


そんなこんなで聖夜に1人、652の文章を読み上げる奇怪な男が爆誕するのでした。

さて、ここからが本番ですね。
と、言ったもの、本日はここまで。次回は652文を読み上げた感想かな。



【2024.01.08 追記】
用意する自身の音声データの形式は以下の通りです。

  • 44.1kHz

  • 16bit 

  • モノラル


この記事が気に入ったらサポートをしてみませんか?