DMMボイスリリースと今後の計画
こんにちは。Algomatic Global カンパニーCEOの原田(@1230yuji)です。Algomatic GlobalはこれまでDMM動画翻訳とDMM GAME翻訳を立ち上げ、運営してきました。
この記事では、新たに立ち上げたDMMボイスについてご紹介します。
プレスリリースもせずにβ版ということでクローズド公開したのですが、想定外にYahooニュースにまで掲載され、僕のポストも20万impまで伸びてしまいました。
DMMボイスとは
テキストを入力すると迫真の演技で読み上げてくれる音声生成サービスです。
TTS(Text-to-Speech)と言ったりします。
エンタメ系のクリエイティブを作るのに最適で、このあとにもご紹介しますがいろんな方がすでにたくさん作品を作ってくれています。
使い方も多くの方が既に解説してくださってますので見て頂いたほうが良さそうです。
どんな動画が作られているのか
かなりたくさんの動画が既に作られているのでほんの一部だけご紹介しますが、こんな感じの動画に声を誰でも簡単に入れることができるようになります。
たった4日で概算700万文字の音声が生成されました。
一度に70文字までしか生成できない制限を入れているのに驚異的な数字です。 (70文字制限入れてなかったら相当お金が吹き飛んでいた笑)
実際DMMボイスを触っているとわかるのですが、すごく楽しいんですよね。
声がリアル過ぎて本格的な動画を簡単に作れるので、作り始めると止まらない癖になるサービスです。
今後の計画
今後の計画はまだ緩いものですので変更可能性が大きいことを前提に読み進めてください。
声のバリエーションについて
声はいま20種類ですが少なくとも年内に100種類まで増やす想定です。
順次新キャラクターもどんどん投下していきます。
ASMRや関西弁等まで用意していきたいと思います。
感情パラメータ設定とAPI機能について
年内には用意できるように進めていきたいと思います。
ネイティブアプリについて
誰でも簡単に使えることがこだわりですので、ネイティブアプリでも音声生成できるようにしたいと考えています。
こちらも簡易なものを年内には用意したいと思います。
ボイスパートナーについて
自分の声を登録して高品質な音声モデルを作成するプログラムを用意します。(音声モデルの作成にはコストがかかりますので審査制とします)
自分の音声が生成された場合、文字量に応じて収益還元されていく仕組みも用意する予定です。
還元率についてですが、具体的な金額を公開することはできませんが、初期については大幅還元していきたいと考えています。
スタートアップでは、まだサービスが小さい時にコミットしたメンバーはストックオプションなどで上場などした時に億万長者になれる仕組みがあります。(ちなみに弊社は上場することはないのでそういった仕組みはありません笑)
サービス初期に関わり、サービスの発展に貢献したメリットをきちんと出していかないとフェアではないと思いますので、声の提供者に関しては初期フェーズは大きく還元していきたいと考えています。
それぞれのボイスごとに禁止ワードを登録することで自分の声で発言させたくない言葉を発言させないようにコントロールできるような仕組みも考えています。
このページの「声の提供はこちら」から応募が可能です。
まだスタートしていないのでウェイティングリストに登録するようなイメージになります。
料金プランについて
アプリケーションについては、フリーで使える枠も残しつつ、月額〇円で70文字制限を外して上限〇文字まで使える、のような形でプランを用意していく想定です。
また、それぞれのプランの上限文字数の範囲でAPIも使えるようにする予定です。
採用
実はかなり少数精鋭のチームで開発しております。
組織の作り方なども特殊な考え方で回しています。
API利用申請の問い合わせも大量に来ておりまして、今回の反響を受けて体制拡大を急いでいます。
もしご興味持っていただけたらご連絡いただけると大変心強いです。
ご興味あれば原田(@1230yuji)までお声がけいただけると大変嬉しいです。