見出し画像

【📍完全版】世界が震撼したOpenAI最新アップデートまとめ《GPT-4o、デスクトップアプリ、音声会話》

日本時間2024年5月14日 2:00AMにOpenAIが再び革命的なアップデートを発表しました。


大きな革新的な発表としてはGPT-4oが公開されたことになります。

この発表で株価が暴落した企業も出てきた、、、


そして、今回のアップデートでは、誰もがAIの恩恵を受けられるようになります。以下の3つのポイントを抑えれば、OpenAIの最新動向がわかります。

  1. ChatGPTデスクトップアプリ公開

  2. 音声会話のレベルが向上:ほぼ人間並み

  3. GPT-4o APIが公開("o "は "omni "の意味)

1と2は一般ユーザーに大きな影響を与え、3は主に開発者向けの変更点です。それでは詳しく見ていきましょう。

こちらがライブデモのフル動画になります。


0.そもそもGPT-4oとは?


要はGPT-4の上位互換のモデルです。
無料で全ユーザーに解放されております。


一番の特徴はやはりその速度です。

主な特徴

  • マルチモーダル対応:テキスト、音声、画像の組み合わせを入力として受け取り、同様に多様な形式の出力を生成可能。

  • 高速応答:音声入力に対して232ミリ秒、平均320ミリ秒で応答し、人間の会話とほぼ同等のスピード。

  • 多言語対応:GPT-4 Turboと同等の英語およびコード処理能力を持ち、非英語テキストでも大幅に改善。

  • コスト効率:APIではGPT-4 Turboよりも2倍高速で、価格は半分、レート制限は5倍に。


1.ChatGPTデスクトップアプリ公開



無料・有料ユーザーを問わず、コンピュータ上で行っているあらゆることにシームレスに統合できるように設計された、macOS用の新しいChatGPTデスクトップアプリリリースされます。

簡単なキーボードショートカット(Option + Space)で、即座にChatGPTに質問することができます。また、アプリ内で直接スクリーンショットを撮り、議論することもできます。

具体的には
・Zoom会議中や開発環境に横に表示させておくことで、リアルタイムでアドバイスをもらえます
・ローカルで動く別のアプリの画面解析もでき、コードの修正やグラフの解析なども可能です。
・また、音声入出力にも対応しています。

これにより、やはり音声でPC上のアプリを操作できるのは最強です。

例えば、誰でも手軽にプログラミング講師やZoom面接中にアドバイスしてくれる先生を雇えているようなものです。

Open Interpeterのようなことが実現しました。

詳細はこちらの公式ページを参照してください。

https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/

2.音声会話のレベルが向上:ほぼ人間並み


2.1 音声の質の大幅向上


ChatGPTの音声会話の質が飛躍的に向上し、ほぼ人間並みになりました。会話速度は人間と同程度で、感情表現もできます。声の抑揚を変えたり、途中でトーンを変えることも可能です。歌を歌わせることもできます。


2.2 視覚機能(Vision)


動画の情景をリアルタイムで理解できるようになりました。登場人物の理解も可能です。数学の問題を解くこともできます。


2.3 リアルタイム翻訳


ほぼ遅延なしでリアルタイム翻訳ができるようになりました。これからは海外旅行に行く際はChatGPTさえあれば言語の心配は不要そうです。

今後の予定としては、数週間以内にChatGPT PlusのアルファテスターにGPT-4oを搭載した新しいボイスモードが提供開始される見込みです。

3.GPT-4o API が公開

※("o "は "omni "の意味)

3.1 概要と性能の比較

GPT-4oという超高性能で超高速のモデルがリリース&利用できるようになりました。


GPT-4oはかつて最強の謎のモデルと呼ばれいていたGPT2にあたります。
これが意外と衝撃でしたw

https://x.com/LiamFedus/status/1790064963966370209


また、GPT-4oはGPT-4 Turboと比べると以下のような特徴があります。

・速度:2倍高速
・料金:半額
・RateLimit:5倍まで緩和
・Claude 3 OpusやGemini Pro 1.5を超えるクオリティ
・既に誰でも利用可能

3.2 圧倒的速度

実際に使ってみると、そのスピードの速さに驚かされます。開発者にとって嬉しい変更点が多数あります。GPT-4 Turbo時点でGemini 1.5 ProやClaude 3 Opusより安価なので、これからさらに利用者が増えることが予想されます。

3.3 トークンの圧縮

また、トークンも圧縮されました。これでより長い文章の入力と出力が可能になります。

細かい機能要件を見たい方はこちらの公式ブログを参照してください。

https://openai.com/index/hello-gpt-4o/

GPT-4oの主な特徴:

  • テキスト・音声・画像を単一のニューラルネットワークで処理

  • 会話でのAI応答時間は平均320ミリ秒。人間並みの速さを実現

  • 英語とコードでGPT-4 Turboと同等の性能、英語以外の言語は大幅改善

  • ビジョンと音声の理解力が既存モデルを大きく上回る

OpenAIによる安全性への取り組み:

  • サイバーセキュリティや悪用リスクを徹底評価

  • 70人超の外部専門家によるレッドチームテストを実施

  • 倫理的で安全性の高いAI開発を追求

GPT-4oの提供開始:

  • 本日よりChatGPTとAPIで利用可能

  • 音声・動画機能は近日中に信頼できるパートナー向けに提供開始


4.GPT-4o活用事例7選


4.1 手書きをパワーポイント化

4.2 3Dモデルの作成

4.3 2chスレッドの作成

4.4 漫画の高度な理解

4.5 手書きからコード化

4.6 東大入試の解答 


4.7 公式からの活用事例


5.おまけ


5.1 無料で公開される機能

また、以下の機能が無料で公開される予定です。


・GPT Store
・Vision(画像、動画解析)
・インターネット検索
・メモリー機能
・Advanced Data Analysis

無料でこれだけの機能が使えるようになるのは、競合他社にとって大きな脅威となりそうです。

5.2 動画解析ならGemini 1.5 Proが強い



5.3 ライブデモのスマホが何故かオフライン?w


今回のOpenAIのLive Demoで一番気になったのはもしかして、このデモインターネットに繋がっていない?笑

見た感じ、機内モードでWifiにも接続されていない模様。

これはテスト版でローカルで動いているのか??

真相は如何に、、、 個人的に今回のLive Demoは録画感が凄かったw

GPT-4oのテキストのみは既に利用可能ですが、音声チャットはまだ使えません。個人的には明後日くらいにGoogleの大きな発表があるので、まだ未完成ですが、一旦公開したかったという意図があるように思えます。


5 .まとめ


OpenAIは今回のアップデートにより、さらに業界をリードする存在になったと言えるでしょう。

特に

  • デスクトップアプリによる他アプリの操作
    ⇨より広範囲のことが自動化できる
    ⇨例えば、ブログ書いてアップしておいて〜
    ⇨AIによる完全仕事の自動化にまた一歩近づく

  • APIの性能アップ+低価格化
    ⇨これは開発者歓喜でさらにAIサービスのコストを下げて性能を上げることができます

  • 機能の無料化
    ⇨これは完全に他者を潰しに来ております
    ⇨ある程度マネタイズができている証拠でしょうか??

GPT-5、音声電話、ChatGPTの検索強化などまだまだ噂ベースですが公開されていない機能は沢山あります。

引き続きOpenAIがAI業界を席巻するのか。今後の動向に期待です。

ここから先は

0字
月に2本以上読むなら、マガジンの月額購読がおすすめです。 昨今のAIトレンドに乗れるか乗れないかで数年後は大きく差がつくでしょう。 産業革命に匹敵する最新の生成系AI情報を余すことなく発信するので、是非ビジネスや私生活に役立ててください💪💪 👥こんな方におすすめ ・今の業務を効率化したいビジネスパーソン ・新たに副業を始めたいビジネスパーソン ・新規事業をしたい経営者 ・データアナリティスト ・投資家 もはや全員が対象ですw 間違いなく今のAIを知ってるかで生活が変わります!

毎月10記事以上のマガジンが届いて、たったランチ1回分の料金です👀 (1日換算ですと、約50円程度の破格の料金です🔥) 最新のAI情報…

この記事が気に入ったらサポートをしてみませんか?