見出し画像

高度な音声機能を搭載したChatGPTの『今後』について解説します❗️一緒に使うべきAI技術とは❓️「Advanced Voice Mode」でほぼドラえもんクオリティの人間らしい会話が可能になったChatGPT(OpenAI)の今後の展望やAPIについて解説します❗️(※サムネ・画像準備中です。)

はい、皆さん!お久しぶりです、葉加瀬あいです!最近、更新が止まってしまって申し訳ありませんでした。

(実はカクカクシカジカで、某東京都知事の出身大学?であるカイロの新市街に行ってきたのですが、飛行機が飛ばなかったり、乗り継ぎが面倒だったりと、散々な葉加瀬でした。🥲)

さて、そんなこんなで、現在は絶賛時差ボケ中で、AIについては1週間ほど浦島太郎状態でしたが、気を取り直してまた解説を再開したいと思います!

今回の内容は、ChatGPTのAdvanced Voice Modeと、ChatGPTの今後についてですね!

この内容は、次回の記事でも紹介する、『イマChatGPTと合わせて使うべきAI技術』にも関わってくるので、ぜひ最後までご覧ください!

それで、今回ご紹介するChatGPTの最新技術は「Advanced Voice Mode」という名前でリリースされています。

多くの方が記事で紹介しているので、今回はそのAdvanced Voice Mode、またの名を「高度な音声モード」について深堀りして解説します!さらに、ChatGPTやOpenAIの今後についても触れ、それを踏まえた上でどのようなAIツールを使っていけば良いのか、簡単に解説していきたいと思います!

なお、私のメンバーシップに入門されている方は、
いつものように、記事の内容を動画で確認できます!スキマ時間で最新のAI情報を手軽にキャッチしたい方はこちらからどうぞ!

(CommingSoon)

それでは早速 行ってみましょう!



1. アドバンスドボイスモードの解説

いやー、それにしても日本に帰ってきたら、前から話題だったChatGPTの音声チャットモードが使えるようになっていて、すごく衝撃を受けましたね!

## 2.他AI技術(ちょっと最新技術紹介):Dream Machine、Kiling、Tost AI
さらに、Luma AI社Dream Machineがv1.6にアップデートされて、動画の生成速度がなんと10倍になったんです!つまり、約20秒でフル品質の出力が可能になっています。実は、後ほど解説するAPIでも利用できるようになっているんですが、ちょっと話がややこしくなるので、詳細な解説はここら辺で留めておきますね。

それともう一つ、TikTokをリリースしているByteDanceが提供しているKilingという動画生成AIで、リップシンク機能が公開されましたね!写真や動画、バーチャル試着など、すべて利用できるので、動画生成がとてもやりやすくなっています。例えば、画像を何枚か用意して特定のキャラクターがおしゃべりする動画を作ったり、PVの音楽の作成を自動化したりすることも可能です。これがあれば、かなり便利ですね!

一応、こちらのTost AIという技術を使っても、最新の技術に触れられるようになっていますので、ぜひ試してみてください。 


3. アドバンスドボイスモードの解説

さて、話を戻しますと、このAdvanced Voice Modeについて簡単に解説すると、ChatGPTの有料プランのユーザーに向けて公開された、自然な会話が行えるAIです!冒頭までの応答時間が0.3秒ととても早く、感情豊かに本当の人間のように話してくれるので、まるで何でも知っているドラえもんと話しているようなイメージを持っていただければ大丈夫です!

ここら辺の動画を見てみると、さらに分かりやすいと思います。

動画を見ていただくととても分かりやすいのですが、何と言っても人間のように話せる高性能のTTS(テキスト・トゥ・スピーチ)技術が素晴らしいですね。このTTSは正式名称をText-to-Speechと言い、AIが音声を発して喋ってくれる形のものを想像すると良いかと思います。

ChatGPTのAdvanced Voice Modeなどは、音声を文字起こしなしでそのまま理解するマルチモーダルアーキテクチャという技術にも注目が集まっていますが、この高性能なTTSは、ここまでの性能は他の技術ではまだ実現できていないので、本当にすごい技術です。

聞いているとよくわかるのですが、フィラーと呼ばれる「えーと」や「あの」といった人間が会話の間で発する言葉を入れたり、感情を込めたり、たまにはボソボソ声を使ったりして答えてくれるわけです。

本当にすごい技術ですよね。ただし現段階ではいくつか注意点がありまして、それが次の記事でお伝えしたいことと、このChatGPTの新しいAdvanced Voice Modeの革新的なところになります。これを押さえておかないと、ただ便利な技術が出てきたなとしか捉えられないので、ちょっとそこのところを解説させてください。

4. 音声に関する注意点と今後の展望

まず、音声に関してですが、

ここから先は

4,752字 / 2画像

🎈葉加瀬のAI研究室 ~あいラボ~ :動画&質疑応答プラン

¥2,599 / 月
あと15人募集中
このメンバーシップの詳細

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?