
【音声生成AI】Speechkiは日本語と英語を混ぜても自然に読み上げてくれた
最近デジタルデータはなんでもAIで生成するのがブームに。
今回読み上げAIを利用して、実用化できるのか?
文章を生成させてみました。
日本語と英語が混ざった音声を生成
AIを始めとして、システムは英語基準で開発されているため、日本語の対応はどうしても難しく。
AIに指示する内容も英語だとより精度が高まりますが、読み上げも英語の方が自然な印象。
デフォルト→英語専用の読み上げAI→日本語専用の読み上げAI
日本語を話していると、日常的に英語が混ざっているので、実験してみた。
実際にiPhone 15の一番の変更点を、下記の動画で公開した。
デフォルトはおそらく検出された言語の担当AIが読み上げると推測。
英語が混ざっていても、しっかり読み上げてくれる。
だが、英語に指定すると、日本語は飛ばして英語の部分だけを読み上げる。
日本語の読み上げAIに指定すると、英語も日本人が聞き取れやすい、カタカナのような英語で話してくれる。
これは素晴らしすぎないか。
英語で記述しても、日本人がわかりやすいようになっている。
身近なアナウンス
身近に音声アナウンスはたくさんある。
他にも作ってみた。
車のナビ
西武線を相鉄線に直通させてみた
天気予報
読み上げAIのクオリティが上がり、誰でもよりSNSに動画を投稿しやすく
これだけ聞き取りやすい自然言語を読み上げてくれるのであれば、顔を出さずに、声も出さずに、より幅広いジャンルの動画を作れるようになるだろう。
さらには商業施設や、システムの組み込みでも利用されるようになると感じた。
続きをみるには
残り
0字