見出し画像

Amazon Pollyの実力は?その2

Amazon Pollyで詩の朗読が出来るのか?

前回はPollyの実力を 宮沢賢治 雨ニモマケズ の朗読で検証しました。今回は検証例を増やす事を目的に男の子のマーチ (作:谷川俊太郎)を題材にします。

男の子のマーチ (作:谷川俊太郎)

おちんちんは、とがってて
月へゆく、ロケット、そっくりだ
飛べ飛べ、おちんちん
鬼が目隠し、 してる間に
_
おちんちんは、やらかくて
走れ走れ、おちんちんおちんちんは、やらかくてちっちゃな、獣みたいだ
走れ走れ、おちんちん
蛇のキキより、もっとはやく
_
おちんちんは、冷たくて
開きかけの、花のつぼみ
開らけ、開らけ、おちんちん
蜜は壺に、溢れそう
_
おちんちんは、硬くって
どろぼうのピストルに、似てる
打て打て、おちんちん
鉛の兵隊、皆殺し

原文入力結果 (音素チューニング無し)

音素チューニング

SSMLを使った音素チューニングを施して、それっぽく仕上げていきます。

<speak>
<prosody rate="80%">
男の子の <phoneme alphabet="x-amazon-pron-kana" ph="マ'アチ">マーチ、</phoneme>
<break time="2000ms"/> 
谷川俊太郎<break time="3000ms"/> 
おちんちんは、とがってて<break time="1000ms"/> 
月へゆく、ロケット、そっくりだ<break time="2000ms"/> 
飛べ飛べ、おちんちん<break time="1000ms"/> 
鬼が目隠し、 <phoneme alphabet="x-amazon-pron-kana" ph="シテルマニ">してる間に、
</phoneme><break time="1000ms"/> <break time="2000ms"/> 
おちんちんは、やらかくて<break time="1000ms"/> 
ちっちゃな、獣みたいだ<break time="2000ms"/> 
走れ走れ、おちんちん<break time="1000ms"/> 
蛇のキキより、もっとはやく<break time="2000ms"/> 
おちんちんは、冷たくて<break time="1000ms"/> 
開きかけの、花のつぼみ<break time="2000ms"/> 
開らけ、開らけ、おちんちん<break time="1000ms"/> 
蜜は壺に、溢れそう<break time="2000ms"/> 
おちんちんは、硬くって<break time="1000ms"/> 
どろぼうのピストルに、似てる<break time="2000ms"/> 
打て打て、おちんちん<break time="1000ms"/> 
鉛の兵隊<break time="1000ms"/> 
<phoneme alphabet="x-amazon-pron-kana" ph="ミナゴ’ロシ">皆殺し</phoneme>
<break time="1000ms"/> 
</prosody>
<break time="6000ms"/> 
</speak>

検証結果

Summary

原文をそのまま喰わせても「読みの間違い」「イントネーション」「間の取り方」がダメダメでした。詩の朗読のように正確性だけでなく表現力を必要とする文章の朗読には、SMLを駆使しても感情や抑揚の表現には、まだまだ実力不足の感は否めません。

英語ではサービスを開始しているNTTS(ニューラルTTS)の日本語Ver.のリリースや、感情表現のSSMLタグの実装が待ち遠しいですね

いいなと思ったら応援しよう!

この記事が参加している募集