見出し画像

voicebox api pythonのWEBツール

いろいろなテキストto音声ファイルのサービスがありますが、
「VOICEBOX」は、その中でも人の声に近い音声化サービスです。

ローカルPCにダウンロードして使え、無料で使えるツールなのですが、
テキストを入力して、音声化、ファイル化などをしていくので、
動画の台本などの音声化は、手作業がかなり必要です。
今回作成したスクリプトは、テキストファイルを読み込んで、各行ごとに
音声化しmp3ファイルを一気に作成するものです。

VOICEBOXは、ローカルPC内でのAPIの利用ができますので、
それを利用して作りました。
以下のようなUIをもったツールになります。

VOICEBOX meno(キャラクターなし)に対応

voiceboxには、「voicebox meno」というバージョンがあります。
voiceboxの方は、キャラクターがあり、キャラクターごとに利用規約があります。また、"「VOICEBOX」利用"という表記は必要となります。
voicebox menoは、キャラクターがないので、キャラクターごとのクレジット表記は必要ありません。ただし、音声を利用する時は、"「VOICEVOX Nemo」利用"という表記は必要になります。

つまり、「VOICEBOX meno」の方が、キャラクターがないぶん、面倒なく使えるということになります。

使いやすいようにWEBツールとしてのUIにしました

話者の選択、速度、声の高さなどを選択でき、
直接テキストをテキストエリアに書いてもいいし、
ローカルPCにあるテキストファイルを指定してもよいです。
また、出力フォルダや出力ファイル名も指定できるようにしました。

動画台本のナレーションテキストを一気にmp3にする方法

  1. 話者、スピード、高さを選択します

  2. テキストエリアでなにか適当な文章を入れて、「変換開始」し、作成された音声ファイルを聞いて、喋り方などを確認します。

  3. テキストファイルの方を選択し、ナレーションのテキストファイルを選択します。出力フォルダや出力ファイル名を指定します。(指定ない場合はデフォルト指定になります)

  4. 「変換開始」を押して、すべて完了するまで待ちます。

  5. 指定のフォルダに複数の音声mp3が作成されています。

Pythonで作製されています。FlaskでWEBツール化しています。

ローカルPCでPythonが利用できることが必要となります。
スクリプトのライブラリのimportで必要なものをpip installしてください。
以下が標準に入っていないので、pip installが必要です。

pip install requests
pip install flask
pip install pydub

収録ファイルは以下の2つです。

  • voicebox_flask.py

  • templates/index.html

ここから先は

95字 / 1ファイル

¥ 15,000

この記事が気に入ったらサポートをしてみませんか?