見出し画像

【音声生成AI】Speechkiは日本語と英語を混ぜても自然に読み上げてくれた

最近デジタルデータはなんでもAIで生成するのがブームに。

今回読み上げAIを利用して、実用化できるのか?
文章を生成させてみました。

日本語と英語が混ざった音声を生成

AIを始めとして、システムは英語基準で開発されているため、日本語の対応はどうしても難しく。

AIに指示する内容も英語だとより精度が高まりますが、読み上げも英語の方が自然な印象。

デフォルト→英語専用の読み上げAI→日本語専用の読み上げAI

日本語を話していると、日常的に英語が混ざっているので、実験してみた。
実際にiPhone 15の一番の変更点を、下記の動画で公開した。

デフォルトはおそらく検出された言語の担当AIが読み上げると推測。
英語が混ざっていても、しっかり読み上げてくれる。

だが、英語に指定すると、日本語は飛ばして英語の部分だけを読み上げる。

日本語の読み上げAIに指定すると、英語も日本人が聞き取れやすい、カタカナのような英語で話してくれる。

これは素晴らしすぎないか。

英語で記述しても、日本人がわかりやすいようになっている。

身近なアナウンス

身近に音声アナウンスはたくさんある。

他にも作ってみた。

車のナビ

西武線を相鉄線に直通させてみた

天気予報

読み上げAIのクオリティが上がり、誰でもよりSNSに動画を投稿しやすく

これだけ聞き取りやすい自然言語を読み上げてくれるのであれば、顔を出さずに、声も出さずに、より幅広いジャンルの動画を作れるようになるだろう。

さらには商業施設や、システムの組み込みでも利用されるようになると感じた。

続きをみるには

残り 0字

この記事が参加している募集

AIとやってみた

この記事が気に入ったら、サポートをしてみませんか?
気軽にクリエイターの支援と、記事のオススメができます!
後藤 優介(Yusuke Goto)

メンバーシップ加入で、全ての記事が閲覧できます。