DMMボイスリリースと今後の計画

2024年11月5日 12:58

こんにちは。Algomatic Global カンパニーCEOの原田（@1230yuji）です。Algomatic GlobalはこれまでDMM動画翻訳とDMM GAME翻訳を立ち上げ、運営してきました。

この記事では、新たに立ち上げたDMMボイスについてご紹介します。
プレスリリースもせずにβ版ということでクローズド公開したのですが、想定外にYahooニュースにまで掲載され、僕のポストも20万impまで伸びてしまいました。

DMMボイスのクローズドβ版をリリースしました！
このサービスは喋らせたいテキストを入力するだけで自然な音声で読み上げる音声生成サービスです。
スマホ対応なしログインなし決済なしの超簡易バージョンです笑
ぜひ一度試しに触ってみてください。https://t.co/9zr7844Iii
— 原田祐二 Algomatic Global CEO (@1230yuji) October 31, 2024

DMMボイスとは

テキストを入力すると迫真の演技で読み上げてくれる音声生成サービスです。
TTS（Text-to-Speech）と言ったりします。

エンタメ系のクリエイティブを作るのに最適で、このあとにもご紹介しますがいろんな方がすでにたくさん作品を作ってくれています。

使い方も多くの方が既に解説してくださってますので見て頂いたほうが良さそうです。

超話題のAIテキスト読み上げサービス、#DMMボイスのクローズドβ版を早速さわってみました✨自然な音声をスマホでもサクサク生成できて控えめに言って最高です🙆‍♀️✨
今現在は、登録なし無料で使えます。
商用利用などについてサクッとまとめたから動画みて🥹✨ https://t.co/2tMsg8bInC pic.twitter.com/4eihyY7rtT
— かなまる🙆‍♀️ママがはじめるAIとデジタルハック (@uniyume) November 2, 2024

どんな動画が作られているのか

かなりたくさんの動画が既に作られているのでほんの一部だけご紹介しますが、こんな感じの動画に声を誰でも簡単に入れることができるようになります。

バズらないと出られない国のアリス
予告編（仮）
DMMボイスさん、マジでこのAIは神ですよ・・・！届いてますか？この感動しているユーザーの声が・・。これが無料？会社１ヶ月くらい休みたい。… pic.twitter.com/0LPIkNjQ9K
— yachimat@AI漫画・ジャンプルーキー (@yachimat_manga) November 1, 2024

DMMボイス試してたら「ゲームのPVや冒頭」風シーンが作りたくなったのでやってみました

BGMは最近udioで生成してYoutubeに投稿したもので、エフェクトや字幕はAfter effectsで編集してます

固定ポストやリプにBGMのフルバージョン置いとくのでよかったら聴いてみてください#DMMボイス #udio pic.twitter.com/WxXSWAdTFE
— Lu:Na:Clock (@clock_luna) November 3, 2024

時の断片 #AIVideo #AIanime #AI眼鏡部
Gen3 Advanced Camera Controlをかなり使って画面を作ってみました。Zoomばっかりですが。適当にランダムに出てくるのよりは制御しやすい気がします。やはり、DMMボイスで声を当てています。さすがに作成に５時間かかりました。#AI動画生成チャレンジ 17日目 pic.twitter.com/KpBCx6H6g2
— Alone1M (@Alone1Moon) November 4, 2024

たった4日で概算700万文字の音声が生成されました。

一度に70文字までしか生成できない制限を入れているのに驚異的な数字です。（70文字制限入れてなかったら相当お金が吹き飛んでいた笑）

実際DMMボイスを触っているとわかるのですが、すごく楽しいんですよね。

声がリアル過ぎて本格的な動画を簡単に作れるので、作り始めると止まらない癖になるサービスです。

今後の計画

今後の計画はまだ緩いものですので変更可能性が大きいことを前提に読み進めてください。

声のバリエーションについて

声はいま20種類ですが少なくとも年内に100種類まで増やす想定です。
順次新キャラクターもどんどん投下していきます。
ASMRや関西弁等まで用意していきたいと思います。

感情パラメータ設定とAPI機能について

年内には用意できるように進めていきたいと思います。

ネイティブアプリについて

誰でも簡単に使えることがこだわりですので、ネイティブアプリでも音声生成できるようにしたいと考えています。
こちらも簡易なものを年内には用意したいと思います。

ボイスパートナーについて

自分の声を登録して高品質な音声モデルを作成するプログラムを用意します。（音声モデルの作成にはコストがかかりますので審査制とします）
自分の音声が生成された場合、文字量に応じて収益還元されていく仕組みも用意する予定です。

還元率についてですが、具体的な金額を公開することはできませんが、初期については大幅還元していきたいと考えています。
スタートアップでは、まだサービスが小さい時にコミットしたメンバーはストックオプションなどで上場などした時に億万長者になれる仕組みがあります。（ちなみに弊社は上場することはないのでそういった仕組みはありません笑）

サービス初期に関わり、サービスの発展に貢献したメリットをきちんと出していかないとフェアではないと思いますので、声の提供者に関しては初期フェーズは大きく還元していきたいと考えています。

それぞれのボイスごとに禁止ワードを登録することで自分の声で発言させたくない言葉を発言させないようにコントロールできるような仕組みも考えています。

このページの「声の提供はこちら」から応募が可能です。
まだスタートしていないのでウェイティングリストに登録するようなイメージになります。

料金プランについて

アプリケーションについては、フリーで使える枠も残しつつ、月額〇円で70文字制限を外して上限〇文字まで使える、のような形でプランを用意していく想定です。
また、それぞれのプランの上限文字数の範囲でAPIも使えるようにする予定です。

採用

実はかなり少数精鋭のチームで開発しております。
組織の作り方なども特殊な考え方で回しています。

API利用申請の問い合わせも大量に来ておりまして、今回の反響を受けて体制拡大を急いでいます。

もしご興味持っていただけたらご連絡いただけると大変心強いです。

ご興味あれば原田（@1230yuji）までお声がけいただけると大変嬉しいです。