見出し画像

VOICEPEAKマジですごい

みなさんVOICEPEAKというソフトをご存じでしょうか?

『VOICEPEAK』は、最新のAI音声合成技術を搭載し手軽に読み上げさせることが可能な入力文字読み上げソフトです。
お好みの文章や言葉をテキストで入力するだけで、簡単に高品質な音声が作成できます。感情パラメータによる喜怒哀楽の表現にも対応しています。

https://www.ah-soft.com/voice/6nare/

初音ミクが出て15年になりますが人工音声はだいぶ市民権を得たと思います。最初は単なるオモチャという扱いだったのに、歌姫としての「人格」すら持つようになっています。それくらい浸透してきたと思いますが、最初のころはまだまだ使い方が難しく、うまく歌わせるための調整が必要だったようで、この調整作業は「調教」と呼ばれていました。

Voicepeakのすごさ

無調整でかなりいける。これに尽きます。
さらにイントネーションとアクセント、音の長さといったシンプルな調整と、感情表現という全体調整のバランス。

音声のクオリティがすごい。人口音声にありがちなノイズが全然入らない。デジタルで音声波形を作成する上で技術的にしょうがなかったのかもしれないけれど、その点がほとんど気にならないレベルになっている。

正直言えば、「人間のように話させるための調整」はかなり労力が必要です。私もチャレンジしてみました。たかだか40秒くらいの動画でも調教に1時間は余裕でかかりますww
あと、元の動画のタイミングにどうしても合わないところは動画編集ソフトで変更してみました。

参考にしたのはこちら

元々こういうしゃべり方を再現する為のソフトじゃないですからね、これはしょうがない。あくまでこれはどの程度出来るか?を確認しただけです。

テレワーク時代

コロナ渦であまり外へ出なくなったので、動画コンテンツやウェビナーをやろうという会社も増えたと思います。私もコロナの間に外にでれないのでテレワーク中に結構多くの動画を作成しました。でも大変なのが、、、、、

音声録音

これ、やった事の無い人はわからないと思います。機材とかソフトとか、大変そうに思うかもしれませんが、そういうものよりも大変なのが、、、

録音環境

所詮、ほとんどの人は喋りのプロではないので5分くらいの説明でも何回も噛みます。「5分くらいだったら余裕で出来るでしょ?」とか思うやつはアホ。「ただ話すだけ」と「台本通りに話す」は全然違う。素人は台本通りに話すのだって一苦労なんです。そこに追い打ちをかけるのが、、、、

録音中に入る雑音

「よし、今回は上手くかまずに行ける!」って思ったら、家の外で犬の鳴き声、車やバイクの通過、子供の声、なんなら飛行機とか。ありとあらゆる雑音が入ってきます。もちろんある程度の機能のあるマイクには、ノイズキャンセラーみたいなのはありますが、それはある一定の雑音には有効であっても、突然の犬の鳴き声を消したりは出来ません。

みなさん、家に防音室なんてないですよね?会社にも無い方が多いのではないですか?だいたいあったとしても、「外に音が出ずらい部屋」程度なんです。「そとからの音を防ぐ」とか「その部屋で余計なノイズが無い」という意味ではないんです。
うちのオフィスには電話やオンライン会議用ルームがあります。そこでやればよいかと思ったら、録音するとわかる空調の雑音、、、、

でも!Voicepeakには雑音なんて入りません。だって録音じゃないから。

実はうちの長男にこのソフトを見せたら、速攻でポチってしてしまったので、私が個人的に買う必要はなくなってしまったのですが、仕事用に会社に買わせて、動画コンテンツを作る計画でも立ち上げようかと思っています。

商用利用が従量課金制ではない

会社に買わせようかと思った理由はこれ。商用利用に関してのハードルが低い!!素晴らしい!自分で声を録音してむちゃくちゃ苦労したので、いろんな音声ソフトを探していたんです。でもどうしても商用利用する為にはお金がかかる。

CeFontの商用利用

金額の大きさよりも「使用量もサブスクリプションで、出力には文字単位で継続的にお金がかかってくる」って申請が面倒なんですよ。所詮、メインの仕事ではないところで利用したいレベルだとなかなか手が出せないです。

私の仕事はソフトウェア関連なんですが、ソフトウェアの初期トレーニングコンテンツやサポートコンテンツを一定のクオリティで作るには、かなり有効かと思っています。

この記事が気に入ったらサポートをしてみませんか?