見出し画像

音声合成 どうぶつの森のモノマネ

必ずしも「流暢な音声」は必要ではない

音声合成は、キャラクターがしゃべる、という使われ方をすることが多いのですが、そこで人間のようにすらすらと滑らかにしゃべることが必須、じゃない場合もあります。

どうぶつの森の場合、ちょっとクセのあるキャラたちが、なんか一生懸命しゃべってます。音を聞いても何を言ってるか分かりません。でも、一生懸命な感じが伝わって愛くるしい。

つまり、表現したいことが分かっていれば、しゃべらせるやり方は「高品質」である必要はないのです。

どう森、どうやってるの?

あのしゃべり、いったいどうなってんのか、推測でやってみました。

よく聞いても、文字はとらえられない。では、意味のある文字ではないのでは?と考えて、適当に文字を並べてみたところ…

実際の音をお聴きください。

あsdjk多ポイウエブい終えポイ乳母jだs;lkじゃえおぴあjおいぐあじゃd;lkじゃ dg杯dぼパいう亜dbじゃjk;あjk;だklgじゃてあjk

合ってるか、は分かりません。

文字表示とシンクロしてるので、まずは正確な文字を並べて、その文字列をランダムに変換して再合成、といった処理を行ってるのかもしれません。結構なセリフ量なので、それを自動化してるかも。

今ある品質でも使い方で

どう頑張っても100点にならない音声合成技術。

このように、「コンテンツに合った使い方」をすれば、いつだって楽しく使える訳です。

しかし、うまい具合に可愛さを出してますなー。感心しますなー。くそー。悔しいぞ。

まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います!そしたら、もっと面白い記事を書く時間が増えます!全額自分のため!