【ビジネスネタの宝庫】ChatGPT最新アプデで生まれた新サービス+活用事例15選

2023年11月12日 21:08

みなさん、こんにちは。チャエンです！
（自己紹介はこちら）

11月7日にOpenAI Dev Dayが開催され、ChatGPTの大幅アップデートが公開されました。

【⚡️これさえ見ればOK ：歴史が動いたChatGPT最新アプデ５選】

11月7日、OpenAI DevDayでヤバすぎる情報が解禁

情報が多すぎますが、ビジネスパーソンとして見るべき情報を５選にまとめて抜粋。

①APIが大幅改善
・128Kトークン
　∟P.300以上対応、現状のLLMで1番長い

・画像生成, 画像理解,… pic.twitter.com/ZUrjdWXDPv
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) November 6, 2023

今回は発表された機能で最もビジネスに転用できる、画像解析GPT-4Vとリアルタイム音声変換について解説していきます！

ChatGPTに目と声が実装されたことで、できることが増えました。新規事業で使える事例もまとめたので、一度目を通してください！

1.今回のアプデについて

今回の目玉アップデートである画像解析GPT-4Vとリアルタイム音声変換について詳しく解説していきます。

1.画像解析GPT-4Vについて

画像解析機能のGPT-4であるVision APIは、画像を理解しそれに基づいてテキストの応答を生成する能力を持っています。

ユーザーは写真に写っている物の説明を求めたり、画像のコンテキストや内容に関連した質問に答えさせたりすることが可能です。

①具体的な3つの特徴

多様な画像フォーマットのサポート：GPT-4Vは、静止画から動画、3Dレンダリングに至るまで、幅広い画像フォーマットに対応しています。
高度な認識能力：顔認識、物体検出、シーン解析など、様々な画像解析タスクを高い精度で実行できます。
コンテキスト理解：画像内の物体や人物の関係性、シーンの文脈を理解し、それに基づいた分析を行います。

詳細は以下のリンクを参照ください。

②GPT-4Vの応用事例

医療分野：医療画像の解析による診断支援、病変の検出など
セキュリティ：監視カメラの映像解析を通じた異常検出や識別
エンターテインメント：映画やゲームのための高度なビジュアルエフェクトの生成

またGPT-4Vでできることをnoteにまとめているので、こちらも是非参考にして下さい。

2.リアルタイム音声変換:TTS(Text to Speach)

ChatGPTで、人間の声に近い音声を作り出すテキスト・トゥ・スピーチ（TTS）APIが使えるようになりました。
TTSは、テキストデータを合成音声に変換する技術です。この技術は、人間の声を模倣してテキストを読み上げることができます。進歩したTTSシステムは、感情や強調を含む自然な話し方を再現することも可能です。

①具体的な4つの特徴

声の多様性：さまざまな声の種類、アクセント、言語をサポートします。
自然な発音：進化したTTSシステムは、音節や語の発音を自然に聞こえるように合成します。
感情の表現：高度なシステムでは、テキストに応じた感情の表現が可能です。
リアルタイム性：テキストが入力されると、ほぼリアルタイムで音声に変換されます。

ChatGPTのアップデートでは、6つの異なるプリセットされた声と2種類のモデルバージョン「tts-1」と「tts-1-hd」から選ぶことができます。「tts-1」はリアルタイムでの使用に適しており、「tts-1-hd」はより高い音質を求める用途に最適化されています。

②TTSの応用事例
TTSは、現在人間が行なっている作業を代わりにお願いすることが可能になります。

教育：読書障害のある人々や学習者にとって、テキストコンテンツを音声でアクセス可能にします。
アクセシビリティ：視覚障害者のための読み上げツールや情報アクセスツールとして役立ちます。
ナビゲーションシステム：自動車やスマートフォンのGPSアプリでの音声案内に使用されます。
仮想アシスタント：Siri、Googleアシスタント、Alexaなどのデバイスで広く使用されています。

2.新規事業の活用事例15選

GPT-4VとTTSを使った新規事業での活用事例を紹介していきます。

1.ゲーム実況

AIゲーム実況系Youtuberが爆誕する予感！

⚡ How cool is this?

It hasn't even been 24 hours since OpenAI released its Vision API and we're already starting to see its incredible potential.

Peter used it plus text-to-speech to commentate a League of Legends game!pic.twitter.com/GZPouFcOC7
— Javi Lopez ⛩️ (@javilopen) November 7, 2023

2.リアルタイム認識AI

視覚障害者向けのサービスで活躍しそう

WebcamGPT:

GPT-4 Vision API recognizes what is happening in near-realtime, identifies objects and actions...

This took about 10 minutes to build. It's live.
Comment if you want access. pic.twitter.com/iduUyo3sWQ
— Benjamin De Kraker (@BenjaminDEKR) November 7, 2023

3.AGIチャットボット

GPTsという独自チャットボット生成機能。

今まさにGPTsの話題でXのタイムラインは埋め尽くされています。

後日まとめ記事も出します。必見です。

ここから先は

526字

¥ 700

ログイン

この記事が気に入ったらサポートをしてみませんか？