アイディアのみですが、スクリーンリーダーやその音声のSaaS化は可能でしょうか?

昨年、Google Cloud Platformのtext-to-speechの使い方を少し研究していました。
スクリーンリーダーの音声をCloud化出来るのかな?と考えたのがきっかけです。
もうどうやったか忘れてしまいましたが、Google Cloud Platformのアカウントを使い、テキストを投げ、音声ファイルが返って来るというところまで作りました。返ってきたファイルは手動で何かから何かに変換して再生したと思います。
それ以上どうすればいいかはよくわからなかったのと、Cloudを通したらきっと遅くてあまり使い勝手が良くないのかもというイメージのみで、止まっていました。

昨日、とあるオンラインゲームの設定をしたのをきっかけに、そのゲームと、Amazon Web Serviceについて知りました。そのゲームには1億人以上のユーザーがいて、同時使用を呼びかけたイベント時に1秒70テラバイトのデータが流れたそうです。しかも、ゲーム内容はリアルタイムに動くアクションゲームでした。
これが可能なら、何をどう準備して作れば良いかはわからないながらも、原理的には、スクリーンリーダーの音声のSaaS化も、そんなに荒唐無稽なアイディアでもないのではないかと思いました。
検索すると、Pythonでプログラムを書いて、Google Cloud Platformのtext-to-speechの合成音声でテキストデータを読む方法のページも出てくるので、何か出来そうな気はしました。プログラミングのスキルはとても足りないのですが。
AmazonのPolly, Azureのtext-to-speech, Google Cloud Platformのtext-to-speechの3つの選択肢がありそうな気がしています。

そのオンラインゲームの他、Netflix、U-Next、TSUTAYA、Nintendo onlineなどでAmazon Web Serviceが使われていると知り、ネットワークサービス系のプラットフォームとしての存在感を感じました。

この記事が気に入ったらサポートをしてみませんか?