見出し画像

北関東のしゃべりと音声合成の親和性

北関東の言葉。

言語的にはなかなか音声合成と相性が良いんです。

「使われる単語と言い回し」と「イントネーション」の組み合わせ的に。

ちょっとおさらい

文字を入力すれば言葉として出力される音声合成。入れればなんでもしゃべるか、と言えば、結構苦手なものがある、というのはこれまでも書いてきました。

逆に、得意なことももちろんあります。

なんで方言は苦手?

またまたおさらいになりますが、

・方言の学術的ルールが確立されてない

につきます。誰かが頑張って作れば、それに従って読めば良いだけ。

でも、なんで作らないかと言えば、需要の問題です。

特定の地方の言葉の音声合成をお金と時間をかけて作る経済性。

学者

では、標準語と言われる言葉と何が違うのでしょうか。

音声合成の仕組みのおさらい

以前、仕組みについては解説をしています。

簡単に書けば

テキスト→日本語形態素解析(標準語)→イントネーション当てはめ→合成

となります。ここで出てきました、イントネーション。

じゃあ、そこをカットすると?

日本語のイントネーションは複雑そうです。でも、コンピュータの処理に落とし込むと、なんと大きくは2つ。

・上がるか
・上がらないか

これだけ。なので、制御は一つだけ。上がる記号を入れるか入れないか。

これを外してみたらどうなるのでしょうか。きっとフラットな感じになる予定。

北関東の方言になりました・・・

実際にやってみました。

つまり、北関東の方言は

「文字は標準語」
「イントネーションがフラット」

ということになります。もちろん、超ざっくり言えば。

「上がる」場所を決めるルールが、色々な方言で研究されて整理され、さらに言葉の置き換えも自動でできれば、方言合成機ができるはず。

AIとかディープラーニングとかで実現しないかなー。(ひとまかせ)

まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います!そしたら、もっと面白い記事を書く時間が増えます!全額自分のため!