見出し画像

ボボボーボ・ボーボボ。発音してみて下さい。合成だとどうなるか。

音声合成と相性の悪そうな「造語」「固有名詞」系です。だめそうですよね。でも、今回の話、なかなか音声合成の基本を説明するのにちょうどよいのです。

まずはお聴きください

マンガ関係は落とし穴だらけ

実際、マンガ関係は結構厳しいことが多いです。

・キャラの名前
・擬音
・技の名前
・敵の名前
・しゃべり方のくせ

などなど。さらにアニメ化されると、それが声優の特有の癖が足されて、ほぼ追従できなくなります。

どう考えても、参照するデータベースが存在しないのです。

アニメ見る子供

そんな時に発動するルール

まったくランダムにカタカナの単語を普通の文章に挟んでみます。ぜひ、ゆっくり声に出してみてください。

このたび、アフリカに出現した、レナグヤロゴニマオ、に対し、政府は保護をする方針を固めました。

このなんだか分からない単語、たぶん声に出してみると、けっこうみなさん同じイントネーションに近づきます。

多くの人は、

 レ ↑ナ ↑グ ↑ヤ 、 ↓ロ ↑ゴ ↑ニ ↓マ ↓オ

と読むのではないでしょうか。速度が速くてつなげるときは、ロ、は↑になるかもしれません。

これは、単語として9文字の場合はこうなる、という日本語の共通ルールが発動しているから。さらに、真ん中にブレークを入れる、というのも。

例外=プログラムの手におえない

学術用語も含め、ニュースなどでは常に新しい言葉が出てきます。恐らく放送原稿を扱う人は、新着の単語は「うちの局はこうする」と決めると思います。

例外、を決めるのは人間、さらにその扱いを決めるのも人間。これをコンピュータに教えない限り、共通ルール以外はコンピュータは発動できないわけです。

新しい技術も

新語についての「正しい読み方」を決める委員会、というのがあるわけではありません。『世間で多くの人が共通でこのように読んでいる』ことが、ルール策定より先に行われます。

これをうまく活用して、同じ文章を色々な人に読んでもらい、一番中心になるイントネーションを取得する、という『ユーザージェネレイテッド』な『ビッグデータ』収集をして『ディープラーニング』で中心イントネーションを作る、というカタカナだらけの試みもあり、現在、私もそこに関わっています。

たぶん、放送を24時間、自動で学習させるようなこともできるかもしれません。

画像認識

それでも例外は必ず生まれる・・・・

そして、いらすとやさんは結構変な絵もあったりする・・・・



まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います!そしたら、もっと面白い記事を書く時間が増えます!全額自分のため!