![見出し画像](https://assets.st-note.com/production/uploads/images/86307135/rectangle_large_type_2_1494a7e771db6b4f5c1637d7948a29f6.jpeg?width=800)
【自動音声】AI音声合成ソフト顔負け!文章読み上げでVOCALOIDを超える?!ワンクリックで誰でも簡単にアテレコ可能
AI音声技術とは
![](https://assets.st-note.com/img/1662455241968-QrnyglKvOC.jpg?width=800)
皆さん、AI音声技術という言葉はご存知でしょうか?
主にAI技術を元にした自動音声読み上げソフト、字幕抽出ソフト、合成音声ソフトなどがございます。
具体的な内容を説明すると、
自動音声読み上げ
テキストデータを元に機械音声が自動で読み上げをする技術
※ゆっくり茶番劇やVOCALOIDなど
字幕抽出ソフト
動画などの音声部分を分析し、字幕テキストを抽出する技術
※ユーチューブ字幕などで使われています
合成音声技術
自身の音声と他人の音声データを元に音声を合成する技術
※最近、カラオケなどにも導入されています
今回ご紹介するのは、自動音声読み上げ機能で任意のテキストをAIを使って音声変換することができるサービスです。
音声作成ソフトで有名なVOCALOIDと似た、キャラクターボイスチェンジが多数用意されています。
男性ボイス、女性ボイスは勿論のこと、アニメ声、萌え声、ささやき声(ASMR)など幅広いボイスチェンジャーが可能となっているAI音声合成サービスのご紹介です。
便利な合成音声を使おう
普段から動画作成などをされているユーチューバーは勿論のこと、会社の仕事用の資料の動画作成の際に、ちょっとしたアテレコやナレーションをつけたい時に知っておくと便利な物になっております。勿論ご自身の好きなセリフを喋らせることが可能ですので、アイデア次第で活用の幅は様々です。
合成音声読み上げソフトの紹介
元祖ボーカロイド「初音ミク」と言えば、一番有名な音声合成ソフトですが。既に発売から10年以上の時が立っていますが、人気は健在です。
コチラも人気CeVIOシリーズです。様々なバージョンがありますので好きなキャラごとに試してみるのも良いかもしれません。
VOCALOID miki ナチュラルは、人気VOCALOIDシーリーズのナチュラル音声表現に力を入れているソフトです。自然な発声や発音がより人間らしさを表しています。
正直、合成音声ソフトは多数発売していますので悩むところですが、実は無料の合成音声ソフトをいくつもあります。
その中でも特に注目なのが、
『VOICE VOX』シリーズです。
VOICE VOXのご紹介
![](https://assets.st-note.com/img/1662417818234-wzIaDs2MyJ.jpg?width=800)
VOICEVOX
VOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
使い方動画の解説はコチラを参考にしてください。
https://www.youtube.com/watch?v=tD3Pwhs2opw
VOICEVOXのクオリティ
動画をご覧のように、ほぼプロの声優さんと違和感がないほどの再現性です。使い方やアイデア次第では、面白い動画を作成できるのではないでしょうか。
Google ColabでVOICE VOXを使おう
ココからが本題です。
VOICE VOX自体は、無料ですのでダウンロード版やWEB版を利用すればいいのですが、例えばPyhotnなどで組み込んでみたい人はちょっとしたプログラムの勉強がてらに使ってみたい人向けに解説していきます。
写真や動画を喋らせる技術が御座います。
— 鈴木希望@ビジネスアナリスト (@CREATEMS1) September 4, 2022
そして、音声はVOCALOID風の合成音声です。 pic.twitter.com/7OT4Zc9jle
VOCAL VOXと写真を喋らせる技術を使った動画
今回、Google Colabで簡単にVOICE VOXを使う方法をご紹介いたします。
先ずは、コチラにアクセスするだけでOK。
上から順番にプログラムを実行し、環境とインストールを済ませます。
VOICE VOXセットアップ
VOICE VOXのクローン作製
カレントディレクトリの移動
リリースのリストアップ
リリースの切り替え
リリースの設定
VOICE VOXのコア指定
PI)インストール
環境設定
音声合成
![](https://assets.st-note.com/img/1662456273939-ni4fOuQz32.jpg)
VOICE VOXのプログラムをGitHubからコピーしてきます
![](https://assets.st-note.com/img/1662456278669-6t6lDrEbDq.jpg)
カレントディレクトリーの移動
![](https://assets.st-note.com/img/1662456283631-A4PL8KsWQ8.jpg)
リストアップするだけなので特に実行する必要はありません
![](https://assets.st-note.com/img/1662456289263-DWr1QTSgvd.jpg?width=800)
使うバージョンが認識されているか確認
![](https://assets.st-note.com/img/1662456294610-8b25khSJhZ.jpg)
使うバージョンを指定
![](https://assets.st-note.com/img/1662456298767-cBnkllhs8d.jpg?width=800)
VOICE VOXコアの選択で"2"を設定する
![](https://assets.st-note.com/img/1662456317032-KVizmb5cul.jpg)
PIP環境の設定
![](https://assets.st-note.com/img/1662456322972-iDMCKpTJK6.jpg?width=800)
ここまでで環境は整います。
![](https://assets.st-note.com/img/1662456336093-1tbm0L074D.jpg)
パラメーターやテキストを変更して実行すると音声が合成されます。
音声データは、
voicevox_core > example >python
ここのフォルダに保存されていますのでダウンロードできます。
如何でしたでしょうか?
このように簡単に合成音声技術を使って、合成音声を作成することが出来ます。活用の幅は、アイデア次第でいくらでもございますので、是非色々と試してみてください。
その他Google Colabを使った、AIプログラムのご紹介は他の記事を参考にしてください。
AI BOOST初級編の勧め
![](https://assets.st-note.com/img/1662456753292-ZLCWN6c15Y.jpg?width=800)
より高精度なディープフェイク・ディープフェイス技術を使ってみたい方は「AI BOOST 初級編」(7,980円)をご覧いただければ、より柔軟で高度な技術を制限なく簡単に利用できますので、そちらをご購入いただく方がお勧めです。
AI BOOST初級編では、FaceSwapプログラムを使って任意の画像や動画をお好きな顔画像を入れ替えてディープフェイク技術を簡単に学べます。
【悪用厳禁】世界をたった5日で震撼させた驚愕のDeepNude事件とは?
![](https://assets.st-note.com/img/1662456753266-OSjkR5lD9n.jpg?width=800)
今回の記事よりも出来ることが増えていますので合わせて購入していただければ、興味のあることはたいていのことが実現できると思います。
サポートして頂けたら励みになります😉