見出し画像

今の技術で工夫する人vs理想じゃない!と使わない人 音声合成

世の中100点満点のサービスや製品はありません。

それを待ってたら一生使えないぞ、という技術の話です。

音声合成もそうです。

CPUの発達、技術の向上、新技術の導入、など、時代とともに品質も上がってきました。

ずいぶん「人間に近づいた」と言えますが、「近づいた=まだ到達してない」という事でもあります。

ここが本日のポイント。

やはり人間には追い付かない

受験勉強で考えます。

50点しか取れない科目を勉強すると、65点→80点→87点→…みたいに点数は向上します。

でも、いくら頑張っても100点にはなりません。

技術も同じです。

なぜなら100点に近づくと、別の要素が「違い」として明らかになるのです。65点の時は気にしてなかったのに…

画像1

色々な実例(おさらい)

現在、音声合成は95点は取れていると思います。

そうなると、以前は気にならなかった点が気になってきます。

今も指摘できるポイントとしては、

・間が一定
・音量の大小がない
・感情が表現されない
・イントネーションが不自然な箇所が必ず出る
・滑らかじゃない部分がある

など。

多分、発明されて最初にしゃべった時よりむちゃくちゃよくなってるはずなんですが、研究というのは厳しいもので、常にどこかが気になる。

しかも、声というのは研究者じゃ無くても多くの人が毎日触れてるから、これらの違和感はすぐ分かってしまいます。

画像2

割り切りも大切

では、使えないのか?というとそんなこともなく。

これまでに挙げた「足りないところ」を理由に持ち出す人は、たぶん100年後も使いません。営業する時間も無駄なので、さっさと切り上げましょう。

「音声があれば便利なところ」
「音声を録音で使ってたけど合成の方が便利」

というところで使えば良いのです。

じゃあ、それはどこ?というのはまた別の日に。

人間より便利なところがあるんだから、勝負しないでも良いよ!

まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います!そしたら、もっと面白い記事を書く時間が増えます!全額自分のため!