見出し画像

VOICEVOXで自然な音声を作るために気をつけていること

何故この記事を書こうと思ったか

先週、ドンキに立ち寄ったら店内で流れていた映像の音声にずんだもんとめたんちゃんの声が使われていた。
ただ、明らかに区切るべき単語2つが繋がってアクセント調整が/‾‾‾‾\って感じになった発音が修正されておらず、非常に違和感のある音声となっていた。

個人的なことだが、学生時代に機械音声を使って広報用の動画制作をしていた時期があり、その時に機械音声は親しみが感じられないと切り捨てられてノイズまみれの人間の声に差し替えられたことが苦い記憶となっている。
調整不足の機械音声が巷に溢れているのが悪いんだと半ば八つ当たりのような感情をずっと持っていて、ドンキで聞いたその音声でトラウマを思いっきり踏み抜かれた形になった。

そこで、自分がVOICEVOXで声を調整する時に気をつけていることを記事にまとめ、これを読んだ人に自然な音声を作れるようになってもらおうと考えた。

必須事項

音声を作る時、これだけは確実にやるべき。

①単語の区切りを確認する

基本オブ基本。
原稿を流し込んだだけでもある程度しっかり読んでくれるが、稀に単語が意図しない繋がり方をしていることがある。

坂口安吾の『歴史探偵方法論』をVOICEVOXに流し込んでいた時のものを例に挙げる。

一見したところ用途不明の品物が多いが、しかしその存在の理由、使用の目的は必ずなければならぬ。

https://www.aozora.gr.jp/cards/001095/files/61137_77751.html

「ところ用途」で一つの単語として繋がっている。
意図しない部分で繋がっていると、大体不自然な読み方になってしまう。
このような部分がないか全文確認する工程は必須だ。

②単語の読み方を確認する

基本オブ基本その2。
熟語や人名などを正しく読めているかを全て確認すること。

同じ単語でも何故か違う読み方をすることがあるので、全文確認を怠ってはならない。
あと、人間の目ではサラッと読めても機械的には読めないもの(「髙橋」等の特殊な字など)は読点に置き換えられてしまうので直してあげる必要がある。
その他、滅多にないとは思うが直前にある単語とくっついて意図しない単語ができてしまう場合がある。(いわゆるぎなた読みとか「この先生きのこる」的なやつ)
よく使う固有名詞等は辞書登録すべし。

先日、「中日(なかび)」を「中日(ちゅうにち)」と読んで笑った。

より良い音声を作るために

ここからは、より自然な音声を作るためにやってほしいことを書いていく。

①自分の声で読んでみる

自然に聞こえるようにするためには、人間ならどう読むかを確認してそれを再現していけば良い。
そのため、自分は毎回自分の声で原稿を読んでイントネーションや自然な読点の配置などを確認している。

②適度に読点を補う

これは個人の好みによる部分だと思っているので、どれぐらいの長さが良いかは一概には言えないが、ある程度の長さで文を読点で区切って間を空けた方が自然に感じられると思っている。
人間だと一息で読みきれないような長さを休みなしで読んでしまうと、聞いていても内容が頭に入りにくいというのもある。
自分は「原稿を見ず音声だけ聞いて内容がスッと入ってくるか」を一つの基準として読点を補っている。

③読点の長さを調整する

読点を入れた後は、その長さも調整するとよい。
原稿を流し込んだ時点では読点はだいたい0.30〜0.50ぐらいの長さになっている。

これも個人の好みが大きいとは思うが、これをそのままにすると少し間が空き過ぎている印象を受ける。
そのため、その時の読むスピード等を考慮してだいたい0.10〜0.15ぐらいの範囲に調整している。
(読点0.30以上をそのまま使うことはほとんどなく、毎回変えるのがやや手間なので、デフォで設定される読点の長さが設定できる機能とか追加されたら嬉しい)

④伸ばす音の長さを意識する

主に小さい母音で終わるカタカナ語で気をつけていることである。
例えば「インフィニティ」という単語は、文字では「インフィニティ」と書くが発音上は「インフィニティー」というように伸ばしていると思う。
「インフィニティ」と入れると「ティ」の部分が短くやや不自然に感じられるので、読ませる上では伸ばし棒を入れてあげると良い。

実際に読ませて確かめてみてほしい

⑤「〜していた」「~している」のような語尾の調整

他の動詞の後に来る「〜していた」「〜している」等について。
流し込んだ時点では大体以下のようにシテ/イル/となることが多いが、繋ぎ方などで微妙に発音の仕方を変えることができる。

自分が使うことが多いのは以下のパターンがある。
色々読ませて、その場で一番なじむものを選んでいる。

⑥原稿に「」が使われている場合の読み方の確認

「」等の記号が入っている時、読点に置き換えられて間が空く。
その部分で一拍置くのと続けて読むのではどちらが自然かを考え、間がいらなければ読点は削除しておく。

以下で例を示す。
ここで坂口安吾の『歴史探偵方法論』の一節を引用する。

しかし「魏志倭人伝」を証拠物件として現代の法廷へ提出したなら、こんなものが証拠になるか、とタンテイの無能は忽ちバクロされるにきまっている。

https://www.aozora.gr.jp/cards/001095/files/61137_77751.html

これをVOICEVOXに流し込むと、以下のようになる。

「しかし」の後の読点は問題ないが、「魏志倭人伝」と「を」の間に読点が入ると不自然な読み方になってしまうので、このような読点は消しておく。

明らかに間がいらないであろう箇所で間が空くと、カギ括弧を流し込んだまま調整していないなというのがよく分かる。

⑦「イントネーション」でも調整してみる

「アクセント」では大まかな音の上げ下げは調整できるが、上か下かしか調整できないため、それだけでは自然な読みにしきれないことが多々ある。
一音ごとに調整できる「イントネーション」での調整に慣れると、かなり表現の幅を広げることができる。

Altを押しながら操作すれば、一単語分まとめて上げ下げできるため、前後の単語との高さ合わせもしやすい。


最後に、以前作った朗読動画のメイキングも置いておく。



この記事が気に入ったらサポートをしてみませんか?