ボボボーボ・ボーボボ。発音してみて下さい。合成だとどうなるか。
音声合成と相性の悪そうな「造語」「固有名詞」系です。だめそうですよね。でも、今回の話、なかなか音声合成の基本を説明するのにちょうどよいのです。
まずはお聴きください
マンガ関係は落とし穴だらけ
実際、マンガ関係は結構厳しいことが多いです。
・キャラの名前
・擬音
・技の名前
・敵の名前
・しゃべり方のくせ
などなど。さらにアニメ化されると、それが声優の特有の癖が足されて、ほぼ追従できなくなります。
どう考えても、参照するデータベースが存在しないのです。
そんな時に発動するルール
まったくランダムにカタカナの単語を普通の文章に挟んでみます。ぜひ、ゆっくり声に出してみてください。
このたび、アフリカに出現した、レナグヤロゴニマオ、に対し、政府は保護をする方針を固めました。
このなんだか分からない単語、たぶん声に出してみると、けっこうみなさん同じイントネーションに近づきます。
多くの人は、
レ ↑ナ ↑グ ↑ヤ 、 ↓ロ ↑ゴ ↑ニ ↓マ ↓オ
と読むのではないでしょうか。速度が速くてつなげるときは、ロ、は↑になるかもしれません。
これは、単語として9文字の場合はこうなる、という日本語の共通ルールが発動しているから。さらに、真ん中にブレークを入れる、というのも。
例外=プログラムの手におえない
学術用語も含め、ニュースなどでは常に新しい言葉が出てきます。恐らく放送原稿を扱う人は、新着の単語は「うちの局はこうする」と決めると思います。
例外、を決めるのは人間、さらにその扱いを決めるのも人間。これをコンピュータに教えない限り、共通ルール以外はコンピュータは発動できないわけです。
新しい技術も
新語についての「正しい読み方」を決める委員会、というのがあるわけではありません。『世間で多くの人が共通でこのように読んでいる』ことが、ルール策定より先に行われます。
これをうまく活用して、同じ文章を色々な人に読んでもらい、一番中心になるイントネーションを取得する、という『ユーザージェネレイテッド』な『ビッグデータ』収集をして『ディープラーニング』で中心イントネーションを作る、というカタカナだらけの試みもあり、現在、私もそこに関わっています。
たぶん、放送を24時間、自動で学習させるようなこともできるかもしれません。
それでも例外は必ず生まれる・・・・
そして、いらすとやさんは結構変な絵もあったりする・・・・
まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います!そしたら、もっと面白い記事を書く時間が増えます!全額自分のため!