見出し画像

【効率化】読み上げアプリを使って半自動的に動画を作る

研究室紹介の動画を作成しろという話が舞い込んできた.
学生の仕事ではないが,まぁ何とかしてみよう.

自分の声で録音してもよいが,時間もかかるし,取り直しをしたくなる.
パワポだけは過去に作っているのでそれを用いて動画を作りたい.

そんなことで今回は読み上げアプリについて調べて実際に使うところまで行いたいと思います.




読み上げアプリとは

ゆっくり実況やずんだもんなどを最近よく見ますが,あんな感じで文章を機械に音読させるものです.

(背景などは割愛しますが,色んな歴史がありそうでした)


どんなソフトがあるのか?

読み上げソフトと調べて一番上に出てきたのは,

でした.また,色々まとまっているサイトとして,

探している中(5分くらい)で出てきたのは

  • 音読さん

  • softtalk

  • VOICEROID

  • Amazon polly

  • VoiceVox

などでした.

今回はその中でも無料であるVoiceVoxが使いやすそうだったので使ってみる.(無料で商用利用可能で,ずんだもんが可愛いので


VoiceVox

たぶん以下のサイトが公式?のもの.

  • 商用利用も可

  • 利用規約がキャラごとに違う

  • イントネーションの詳細な調整が可能

  • windows, mac, linuxに対応

キャラクターの中には企業が使う場合は,連絡をする必要があるなど色々ありました.

とりあえず今回は,『ずんだもん』を使わせていただければそれでよいので,規約を確認.

ずんだもん 利用規約

ずんだもんの音声ライブラリを用いて生成した音声は、「VOICEVOX:ずんだもん」とクレジットを記載すれば、商用・非商用で利用可能です。

利用規約の詳細は以下をご確認ください。
https://zunko.jp/con_ongen_kiyaku.html

https://voicevox.hiroshiba.jp/

ということで,ダウンロードしていきます.下記リンクに入ると,図1のような画面が開きます.

図1 リンク先の画面

ダウンロードボタンをクリックしてみます.

図2 ダウンロードをクリックしたときの画面

インストール

インストーラがダウンロードできたので実行してみます.

図3 ダウンロードしたインストーラの画面

945MBということで,少し重たいですね.私のノートPCではここで結構時間がかかりました.

しばらくしたら画面遷移したので,次へを押して,appの置き場所を決めて,インストール完了.

図4  実行してしばらく待った後の画面

とりあえずインストールはできました.

使ってみる

とりあえずインストールされたアプリを開きました.

すると文字を打ち込む場所があったので,図5のように文字を打ち込んで,下の三角ボタンで実行してみました.

図5 実行画面

すると音声が出力されました!

図5の下の方で,アクセントやイントネーションなどが調整できました.
(単純に面白い)


半自動化してみる

目的を再確認

目的は,パワーポイントを使って動画を取ることであった.
この動画の音声にvoicevoxを使用したい.

簡単に思いつくのは,文字をvoicevoxにいれて再生し,その音声をパワポのレコーディングで撮ることであった.

しかし,少しノイズが載ったり,外音が載ってしまったので断念.

まぁマクロかpythonで何とかなりそうだと思い,そちらの方向へ.

マクロで半自動化

色々考えて調べてみましたが,以下の手順にしました.

  1. パワーポイントで資料を作成(拡張子:.pptm)

  2. 読み上げたいことをパワポのノートに記載

  3. ノートを読み込んで,APIに投げる

  4. wavファイルを出力する

  5. wavファイルをスライドに張り付ける

  6. 以上をすべてのスライドに張り付ける

  7. 動画としてエクスポートする

この手順を思いついたのは,パワーポイントで発表動画を作った際に,ただスライドに音声ファイルをくっ付けただけで動画が出来ているなと思ったことからでした.

ChatGPTならいけるかと思いきや,voicevox --text "Hello World"みたいなプロンプトを行わせようとしてきました.
これが上手く行かなかったので,いろい調べてやってみることにしました.

成果物

こんな感じになりました.

下記動画は少しプログラムを修正して、話すスピードやスライド間の秒数を編集できるようにしました。

初版のマクロで作成した動画です。
すぐに次のスライドに行ってしまい、違和感があります。

悩みとしては,少し文と文の間の時間を調整しにくいことです.
この辺は何とかしていきたいと思います.

jsonをpythonで書き換えることで何とかしました!

これで半自動的に動画を作れるようになったので、電車移動中でも動画を撮れるようになりました!


マクロのコード

以下のコードで実行できました.
おそらくコピペで活用できます.

ここから先は

2,834字

¥ 1,000

人工衛星を大学で開発しています! いずれは宇宙や衛星,ロケットを題材とした高校生や一般向けの教材を作りたいと考えています!! もしよろしければ応援していただければと思います! 教材をkindleで売る費用や活動費(インタビュなど)で使わせていただきます.