見出し画像

実際に活用されてる「働く音声合成」を見てみる

音声合成は、品質向上とともに、結構色々な現場で使われるようになってきました。そのあたりを紹介してみます。

コールセンター

人間の応対は、まだ人間じゃないと無理です。でも、かけてすぐに、

「ご用件の番号を押してください」
「この電話は品質向上のために録音されてます」

などの部分は、音声合成でやることも増えました。

ここは、機械音声と人間、というところで役割が分かりやすく、これはこれでありかもしれません。

内容の変更、大きな全体的なお知らせ、なとが発生してもすぐに現場で対応できます。

電話アンケート

最近増えたやつ。

こっちの言うことなど聞かず、ひたすらアンケートを取る電話。

あんまり自分は好きじゃないので、すぐ切りますけど。

こちらは、一方的に内容を伝えて、それに答えさせるタイプ。

収録コストや手間、ということを考えると、あんまり良い印象にならない使い方かと思います。

各種アナウンス

レジ

最近、コンビニのレジがしゃべってる声を聴いたら音声合成でした。

「レジ袋が必要な方はお声がけください」
「カードをお取りください」

あたり。レジ担当者が外国人が増えたり、言った言わないが担当者ごとに派生しないように、ということでは良い使い方だと思います。

こちらも、オペレーションが変わっても、即対応可能。

カーナビ

カーナビ

鉄板です。

曲がってください、とか、到着です、などは変化しません。

結構あるのが、ランドマークの施設名や、通りの名前。

場合によって、〇〇町が〇〇市になったりという住所も変わります。

しかも、ランダムに。

こうなると、同じアナウンサーを呼んできてそれだけ収録しなおし、という作業をやるのは大変。

これはもう、お手本みたいな使い方だと思います。

実際、日本のカーナビ、全部音声合成じゃないかね。

駅の到着案内

こちらも駅名の追加や変更、編成の変更で行き先の変更、時間、などを考えて、合成にする場合もあります。

ただ、まだ人間のアナウンスを細切れにして、それを組み合わせる方式も多いようです。

大きな意味ではこれも合成に近い考え方。

でも、まだなぜか鉄道の現場では完全合成方式は聞いた記憶がありません。

人間と違うことをどう考えるか

これらの使い方。

特徴があります。

完全に人間と思ってもらう

ということを目標としてない使い方がほとんど。

実は、それがポイントだったりします。実用されている例をみると、

人間が対応するより合成の方が低コスト
・内容の変更がしばしば
人間の対応が明らかに続くときの入り口で役割分担

みたいな、使い方がはっきりとしています。

利点をしっかり理解して、合成の方が良い、という使い方を見つけられれば、導入はスムーズです。

今回の声は、そんな雰囲気を試してみたものです。

役割分担の意味

どうしても内容には責任が伴います。ここまでは合成、となればその部分の責任は「事業者」。

人間の対応から先は、大きな意味では事業者の責任ですが、狭く見ると対応担当者の責任も出てきます。

顔の見えない世界での責任はなかなか大変。うまく使い分けることで、スムーズな業務につなげられれば、合成も発明された意味があるってものです。

(だんだん合成の味方の人みたいになってきた!)

まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います!そしたら、もっと面白い記事を書く時間が増えます!全額自分のため!