見出し画像

音声合成、イントネーションルール問題を見る、風船と巨人

タイトル画像:女の子と空に舞うたくさんの風船のイラスト

風船と巨人。なんか、童話の題名みたい。

本当は心優しき巨人が人間から恐れられてる。でも女の子がうっかり手を離してしまった風船を捕まえてくれたところから交流が始まり、やがて村を襲う洪水を彼が、おっと、妄想が進みます。ついでにエンディングを想像したら涙が出てきそう。

戻ります。

音声合成は、いわゆる標準的とされるイントネーションルールで合成します。そのため、興味深い振る舞いも見られます。

でも、人間が使う言い回しで、このルールでは対応できないケースもあります。

その場合は手でその文節を手で修正しないといけません。誰か早くAIで解決を!

業務連絡:今回、スクリーンリーダーではうまく発音の違いが表現されない箇所があります。文字表現でそうなってる、と理解して聴いていただければ分かる様に書きます。

ルールにより同じ単語が変化する

風船という単語。標準的な発音では、ひらがな4文字のイントネーションで表現すると、下、上、上、上。

これが、前後に別の言葉が接続されると変化します。

接頭語を接続

例えば、「手作り」を頭につけてみましょう。注意深くゆっくり風船に着目して発音してみてください。

手作り風船

風船、の4文字が今度は、上、下、下、下、になります。

音声合成は、風船という単語に修飾語が接続されたと判断すると、イントネーションを変化させるわけです。えらいなー。

後ろに別の単語

続いて、今の状態で後ろに「協会」を接続します。

手作り風船+協会。これも連続して声に出してみてください。風船、の4文字がまた変わります。

手作り風船協会

風船は、上、上、上、上、となります。

これを処理するのが形態素解析

この単語はこの発音、と1対1ではなく、文章の構造、単語の接続状況で変化させますが、その状態を分析してる仕組みですね。

音声合成はデジタルな技術ではありますが、その制御の源流は「国語」なのです。文系の分析力、ルール化して整理する仕事、これが重要。コラボです。

そのルールから外れる「巨人」問題

読売巨人軍。チーム名を通常2文字で表すとき、どう発音するでしょうか。これも声に出してみてください。

巨人

きょ、を一文字とすると、上、下、下。

でも、一般名称だとどうなるでしょうか。塀に囲まれた街を襲う、恐ろしいあいつらを想像して発音してみてください。

巨人

今度は、下、上、上。

同じ単語ですが、文脈で我々は自然に使い分けています。今度は人間すごい!って話ですね。

野球の歴史を語るコラムなどで、次の文章が出てきたらどうなるか。これも発音してみてください。

球界の巨人として君臨する巨人。

一つの文章に同じ単語が2回出てきて、しかもその発音が変わります。

最初は一般名称、後ろは固有名詞。発音も、下、上、上、から、上、下、下、に変化します。

これは、同じ単語が、一般名詞と固有名詞の2つで使い分けられてる問題。

力士の四股名などでもこの問題は出てきます。

そんな場合の修正方法は、形態素解析前に特定部分を指定の読みデータで読むように制御するか、形態素解析語に読みデータを入れ替えるか、という「そこだけ特別扱い」が今は必要。

面倒くさいったら。

だからAI屋さん、仲良くしましょう!

終わり

まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います!そしたら、もっと面白い記事を書く時間が増えます!全額自分のため!