見出し画像

音声合成 難読漢字は中の人次第!?

どんなテキストデータもツールに入れれば読む!

というわけでもなさそうです。

喋る言葉はデータベースに入っているもの

・・・もしなければ?

四字熟語に限らず、限度はある

・・・・前にも書いたけど・・・

実際にしゃべってもらいました

こんばんわー。今日は寒かったですが、明日からまた暖かくなって、さらにまた寒くなるという。三寒四温って言うんですね。さて、今回は、こんな、少し難しい言葉がしゃべれるのか、チャレンジしてみます!春、が関わる言葉でやってみます。。。。春夏秋冬。これは大丈夫。。。春愁秋思、あれ。早速ダメ。しゅんしゅうしゅうし、って読まないと。じゃ、これ。春日遅遅。なにー。全くダメ。しゅんじつ、ちち、って読むんですよ。これじゃ、オードリーの春日が、ゆっくり登場するまんまじゃん。。。。つまり。データベースに入ってないってこと。

確かに、春日遅遅・・・「えー、相変わらず歩くのが遅いんですけどね」という若林の声が脳内に浮かびます。

対策はある

音声合成は

テキスト

形態素解析→登録辞書

韻律抽出

合成エンジン

音声データ

と処理されます。この日本語の成り立ちを分析する時に参照する「登録辞書」。

登録、ですから、難読漢字の登録をしておけば良いのです。

実際に行われている対策は実用的

この登録作業、例えば数多くのテキストを朗読してるデータを自動収集、などしてもできるかもしれませんが、出現頻度が少なければ、手でやる必要はあります。

なので、経済的に考えればやる価値があるものにその労力は振り分けられます。

その価値がある分野は割と分かりやすい。

カーナビ=カーステ

カーナビのガイド音声。新しいランドマークや道路の名前を毎度同じナレーターを読んで追加録音するのは大変。ほとんどの製品で音声合成が使われてます。

ここでも新しい登録が発生しますが、そんなにランドマークも毎日増えない。

でも増える分野が!

カーナビはナビの他に、カーステレオの側面もあります。

曲名、歌手名を読み上げることもあるのですが、そこ!

曲名は大変なのです。当て字や、記号が入った並び。

オフィシャル髭男dism、シャ乱Q、つのだ⭐︎ひろ。

人間だって迷うかもしれません。

日々生まれる曲名などは毎度毎度誰かが辞書に追加するのです。

もちろん、政治家の名前なども初出はあり得る。

今後は自動化

データの自動収集を、ニュース番組などからやることになるのかなー、と思ってます。或いは朗読のバイト。間違える人がいても多数派に寄せる、などして精度を上げていくこともできます。

色々な技術の集合体、っていう話でした。


まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います!そしたら、もっと面白い記事を書く時間が増えます!全額自分のため!