見出し画像

【自動音声】AI音声合成ソフト顔負け!文章読み上げでVOCALOIDを超える?!ワンクリックで誰でも簡単にアテレコ可能

AI音声技術とは



皆さん、AI音声技術という言葉はご存知でしょうか?
主にAI技術を元にした自動音声読み上げソフト、字幕抽出ソフト、合成音声ソフトなどがございます。


具体的な内容を説明すると、

自動音声読み上げ
テキストデータを元に機械音声が自動で読み上げをする技術
※ゆっくり茶番劇やVOCALOIDなど

字幕抽出ソフト
動画などの音声部分を分析し、字幕テキストを抽出する技術
※ユーチューブ字幕などで使われています

合成音声技術
自身の音声と他人の音声データを元に音声を合成する技術
※最近、カラオケなどにも導入されています


今回ご紹介するのは、自動音声読み上げ機能で任意のテキストをAIを使って音声変換することができるサービスです。


音声作成ソフトで有名なVOCALOIDと似た、キャラクターボイスチェンジが多数用意されています。
男性ボイス、女性ボイスは勿論のこと、アニメ声、萌え声、ささやき声(ASMR)など幅広いボイスチェンジャーが可能となっているAI音声合成サービスのご紹介です。

便利な合成音声を使おう


普段から動画作成などをされているユーチューバーは勿論のこと、会社の仕事用の資料の動画作成の際に、ちょっとしたアテレコやナレーションをつけたい時に知っておくと便利な物になっております。勿論ご自身の好きなセリフを喋らせることが可能ですので、アイデア次第で活用の幅は様々です。

合成音声読み上げソフトの紹介

元祖ボーカロイド「初音ミク」と言えば、一番有名な音声合成ソフトですが。既に発売から10年以上の時が立っていますが、人気は健在です。

コチラも人気CeVIOシリーズです。様々なバージョンがありますので好きなキャラごとに試してみるのも良いかもしれません。

VOCALOID miki ナチュラルは、人気VOCALOIDシーリーズのナチュラル音声表現に力を入れているソフトです。自然な発声や発音がより人間らしさを表しています。
正直、合成音声ソフトは多数発売していますので悩むところですが、実は無料の合成音声ソフトをいくつもあります。
その中でも特に注目なのが、
『VOICE VOX』シリーズです。

VOICE VOXのご紹介

無料のAI音声読み上げソフト「VOICEVOX」

VOICEVOX
VOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。追加したい・改善したい機能があれば、ぜひ開発にご参加ください。

使い方動画の解説はコチラを参考にしてください。
https://www.youtube.com/watch?v=tD3Pwhs2opw

VOICEVOXのクオリティ

動画をご覧のように、ほぼプロの声優さんと違和感がないほどの再現性です。使い方やアイデア次第では、面白い動画を作成できるのではないでしょうか。

Google ColabでVOICE VOXを使おう


ココからが本題です。
VOICE VOX自体は、無料ですのでダウンロード版WEB版を利用すればいいのですが、例えばPyhotnなどで組み込んでみたい人はちょっとしたプログラムの勉強がてらに使ってみたい人向けに解説していきます。

VOCAL VOXと写真を喋らせる技術を使った動画

今回、Google Colabで簡単にVOICE VOXを使う方法をご紹介いたします。

先ずは、コチラにアクセスするだけでOK。
上から順番にプログラムを実行し、環境とインストールを済ませます。

VOICE VOXセットアップ

  1. VOICE VOXのクローン作製

  2. カレントディレクトリの移動

  3. リリースのリストアップ

  4. リリースの切り替え

  5. リリースの設定

  6. VOICE VOXのコア指定

  7. PI)インストール

  8. 環境設定

  9. 音声合成

VOICE VOXのプログラムをGitHubからコピーしてきます

カレントディレクトリーの移動

リストアップするだけなので特に実行する必要はありません

使うバージョンが認識されているか確認

使うバージョンを指定

VOICE VOXコアの選択で"2"を設定する

PIP環境の設定

ここまでで環境は整います。

パラメーターやテキストを変更して実行すると音声が合成されます。

音声データは、

voicevox_core > example >python

ここのフォルダに保存されていますのでダウンロードできます。

如何でしたでしょうか?
このように簡単に合成音声技術を使って、合成音声を作成することが出来ます。活用の幅は、アイデア次第でいくらでもございますので、是非色々と試してみてください。

その他Google Colabを使った、AIプログラムのご紹介は他の記事を参考にしてください。

AI BOOST初級編の勧め

より高精度なディープフェイク・ディープフェイス技術を使ってみたい方は「AI BOOST 初級編」(7,980円)をご覧いただければ、より柔軟で高度な技術を制限なく簡単に利用できますので、そちらをご購入いただく方がお勧めです。

AI BOOST初級編では、FaceSwapプログラムを使って任意の画像や動画をお好きな顔画像を入れ替えてディープフェイク技術を簡単に学べます。

【悪用厳禁】世界をたった5日で震撼させた驚愕のDeepNude事件とは?

https://brmk.io/whTy

今回の記事よりも出来ることが増えていますので合わせて購入していただければ、興味のあることはたいていのことが実現できると思います。

サポートして頂けたら励みになります😉