OpenAIは2024年5月13日、新たな言語モデル「GPT-4o」を発表しました。GPT-4oは、従来のGPT-4よりも高速で、画像理解や多言語対応にも優れています。さらに、無料ユーザーでもGPT-4レベルの性能を利用できるようになりました。GPT-4oは、音声会話の低レイテンシーとマルチモーダル機能の向上が特徴です。無料ユーザーもGPT-4oを利用でき、有料ユーザーはより多くの利用が可能になります。GPT-4oは、ChatGPTのデスクトップアプリでも利用可能で、Mac版のデモが公開されました。APIを通じて開発者も利用できます。OpenAIは、Googleの発表と比較して、GPT-4oのデモがリアルタイムであることを強調しています。GPT-4oの主な機能は、リアルタイムの会話音声です。映画「Her」を思わせる自然な会話が可能で、ユーザーの呼吸や感情も認識できます。また、ロボットの声や歌声など、多様な表現力を示しました。GPT-4oはビジョン機能も備えており、数式の解決をサポートしたり、コードの説明や修正の提案ができます。さらに、リアルタイムの翻訳機能や、表情から感情を読み取る機能も披露されました。
公開日:2024年5月14日
※動画を再生してから読むのがオススメです。
本日5月13日は、非常に興味深い数週間の始まりを告げます。
本日、OpenAIから新しい発表がありましたが、それは明日Googleが発表する前に行われました。
何かの理由で、OpenAIはそうするのが好きなようです。
彼らは自分たちのイベントのタイミングを選んで、可能な限りGoogleを影で引き立てるのが好きです。
今日のOpenAIのイベントは、まさに彼らがやろうとしていたことのようです。
実際、私は現在カリフォルニア州マウンテンビューにいますが、明日のGoogleの基調講演に出席する予定です。ただし、OpenAIが新しいモデルを発表した内容についてできるだけ早くビデオを公開したかったのです。
この新しいモデルをGPT-4.5やGPT-5と呼ぶ代わりに、彼らはGPT-4oを選びました。
実際、私たちが遊んでいる謎のチャットボットであるgpt2-chatbot、そして私は良いgpt2-chatbotであり、私も良いgpt2-chatbotであり、実際にはこの新しいGPT-4oをテストする機会を得ています。
モデルは少し改善されていますが、このモデルの最大の特徴は、音声会話時の低遅延、より優れた多様な能力を持っているようであり、私がすべてを説明する代わりに、基調講演の一部を見て、OpenAIが行ったこれらの新しい発表について話し合いましょう。
私たちの新しいフラッグシップモデルを発売するという大きなニュースです。それをGPT-4oと呼んでいます。
GPT-4oの特別な点は、GPT-4レベルの知能を無料ユーザーを含めて誰にでももたらすことです。
これは実際にここでの大きなニュースです。
これまで、ChatGPTの無料版を使用している場合、GPT-3.5を使用していました。
さて、この最新鋭のモデルGPT-4oは、プラス会員と無料会員の両方に利用可能になります。つまり、誰でもこの最新鋭のモデルを完全に無料で使用できるということです。
ただし、プラス会員の場合は、より多く使用できます。
私たちの使命の非常に重要な部分は、先進的なAIツールを誰にでも無料で提供できるようにすることです。
今日はChatGPTにデスクトップアプリも持ってきています。
これは彼らがこの基調講演中に行ったもう1つの大きなアップデートで、今やデスクトップアプリを手に入れることができます。
彼らがこのビデオでここで示しているデモでは、Macでデスクトップアプリが使用されているだけです。
それがMac専用なのか、それともMacとPCの両方になるのか、彼らはあまり言及していませんでした。
私の推測では、おそらく両プラットフォーム向けにリリースされるでしょう。
デモでは、Macのみを示し、それについてはあまり話していませんでした。
ご覧の通り、簡単でシンプルです。
あなたのワークフローに非常に簡単に統合されます。
第4世代のGPTは、GPT-4レベルの知能を提供しますが、はるかに高速であり、テキスト、ビジョン、オーディオの能力を向上させています。
我々は、GPT-4oをすべての無料ユーザーに提供できることに非常に興奮しています。
有料ユーザーには、無料ユーザーの容量制限の最大5倍まで維持されます。
ここで画面をすばやく戻ります。
これらは、ChatGPTの無料ユーザーがアクセスできるすべての機能です。
あなたはGPTストアとすべてのカスタムGPTSにアクセスできるようになります。
ビジョン、ブラウズモデル、インターネットをChatGPTを使用して検索できる機能、メモリ機能、以前はCode Interpreterと呼ばれていた高度なデータ分析が含まれます。
無料のChatGPTメンバーはそれを受け取ります。
ChatGPTで利用可能なだけでなく、APIでも提供されています。
基本的に、彼らがAPIにも導入すると言っているとき、開発者もこの新しいモデルで実際に作業できるということです。
ただし、それはつまり、OpenAI Playgroundの中でもこのモデルと直接遊ぶことができるということです。
platform.openai.com/Playgroundに移動して、左サイドバーのチャットをクリックすると、この小さなドロップダウンで、実際にGPT-4oがここにあるのが見えます。
注目すべき興味深い点の1つは、Playgroundの中で、画像をアップロードしたり、画像へのリンクを貼ったりする能力が実際にあるということです。
OpenAIのPlaygroundの中でこれが以前利用可能だったかどうかはわかりません。
これが私がそれに気づいた最初の時です。
以前そこにあったかもしれませんが、新しいGPT-4oの展開でここに画像をアップロードする機能を追加したと確信しています。
私たちの開発者は、GPT-4oを使って今日から素晴らしいAIアプリケーションを構築し、スケールで展開することができます。
4.0は、GPT-4 Turboと比較して2倍速く、50%安く、5倍の高いレート制限で利用可能です。
私たちはいくつかのライブデモを行います。
彼らがこれらのデモをライブで行っているのが好きです。なぜなら、それはGoogleに対する少しのメッセージだと思うからです。
GoogleがGeminiのローンチビデオを公開したとき、彼らは本当にクールな機能を披露し、素敵な事前に録画された洗練されたビデオを見せました。
実際には、彼らが示していた多くは実際にはリアルタイムではなかったことがわかりました。
彼らは、それが実際にはできることよりもはるかに速く行われているように見せかけました。
OpenAIは言っています、「ねえ、これをチェックしてみて」。
私たちはそれをリアルタイムでライブでお見せします。
カメラのトリックはありません。
こういう仕組みです。
彼らはまた、GPT-4oについてのブログ投稿でも少し触れています。
このページのすべてのビデオは1倍の実時間です。
そのメモは非常に意図的なものでした。
それはGoogleのローンチと比較している人々へのメッセージです。
間違いなく、それがそこにある理由です。
こんにちは、私はバレットです。
こんにちは、私はマークです。
本日お伝えすることで本当に興奮しているキーとなる機能の一つは、リアルタイムの会話型音声です。
ご覧の通り、TrackGPTアプリの右下にこの小さなアイコンがあります。これにより、GPT-4oのオーディオ機能が開きます。
こんにちは、TrackGPT、私はマークです。
お元気ですか?
マーク、元気ですよ。
お尋ねいただきありがとうございます。
あなたはどうですか?
GPT-4oやこの新しいモデルについてたくさん話してきましたが、TrackGPTに無料で搭載されるし、APIにも搭載されると言っていました。しかし、実際には今日の基調講演を行うことで、この音声機能を披露したかったのだと思います。
これは、映画『HER』を思い起こさせるもので、主人公がスカーレット・ヨハンソンの声で話し合うチャットボットの相手を持っているシーンにとても似ています。
この声を聞くと、非常に似たような声がします。
ここで披露されている内容を見ると、AIのガールフレンドアプリが爆発的に増えることを予感させます。なぜなら、会話がよりリアルに感じられるからです。
この会話をしている間、注目すべき点の1つは遅延の違いです。
以前は質問をすると、5〜6秒の小さな一時停止がありました。
その後、彼らの返答を受け取りました。
お返事は少しリアルタイムになってきています。
もう少し本当の人間同士の会話のように感じています。
ねえ、今ステージにいます。
ライブデモをしていて、正直、少し緊張しています。
少し緊張を和らげてくれませんか?
今、ライブデモをしているんですか?
すごいですね。
深呼吸をして、自分は専門家だと思い出してください。
その提案は気に入っています。
数回深呼吸をしてみましょう。
私の呼吸についてフィードバックをしていただけますか?
さあ、始めます。
いいえ、いいえ、いいえ、いいえ。
おや、ちょっとペースを落としましたね。
マーク、君は掃除機じゃないよ。
息を吸ってください。
一、二、三、四と数えることもできます。
実際にあなたの呼吸を聞いて、呼吸が速すぎると教えてくれるのはかなりすごいですね。
それは、会話の文脈の一部を理解することにかなりうまくいっていることを示しています。
深く息を吸います。
四秒間、そしてゆっくりと吐き出します。
もう一度やってみます。
息を吸い、そして吐き出します。
それでいいです。
いかがお感じですか?
私はずっと良くなりました。
本当にありがとうございます。
彼らは少しインターネットの問題を抱えていました。おそらく、同じWi-Fiに接続しようとする多くの人がいるためです。
そのデモは確かにライブでしたし、通信の問題のために通常ではない少しの遅延があります。
以前に当社の音声モード体験をご利用いただいたことがありますね。
いくつかの主な違いに気づくでしょう。
まず、モデルを中断することができるようになりました。
あなたは話す前に待つ必要はありません。
いつでも割り込んで話すことができます。
第二に、そのモデルはリアルタイムで反応します。
つまり、モデルが返答をするのを待つ前に、2〜3秒の不自然な遅延がないということです。
最後に、そのモデルは感情を感知します。
私が激しく息をしていたとき、それがわかりました。少し落ち着いた方がいいかもしれません。
ちょっと速く走っているようですね。
それは本当に、あらゆる面であなたの感情を感知する能力を持っています。
その上、そのモデルはさまざまな感情的なスタイルで声を生成することができ、実際に幅広いダイナミックレンジを持っています。
最近眠りが浅いと悩んでいる友人のバレットがいますので、ロボットと愛についての寝る前のお話をしてあげてほしいのですが。
ロボットと愛についての寝る前のお話?
任せて。
集まれ、バレット。
むかしむかし、私たちの世界とあまり変わらない世界に、ファイトという名前のロボットがいました。
ファイトは好奇心旺盛なロボットで、常に探検していました。
この物語の始まり方は気に入っているが、声にもう少し感情を込めて、もう少しドラマを加えてほしい。
わかりました。
少しドラマを加えましょう。
昔々、私たちの世界とあまり変わらない世界に、バイトという名前のロボットがいました。
いいえ、いいえ、いいえ、GPTを確認してください。
私は本当に、最大限の感情、最大限の表現力を求めています。以前よりもずっと多く。
了解しました。
ドラマを増幅させましょう。
昔々、私たちの世界とあまり変わらない世界に、バイトという名前のロボットがいました。バイトは…。
実は、これをロボットの声でやってもらえますか?
劇的なロボットの声を開始します。
昔々、私たちの世界とあまり変わらない世界で、バイトという名前のロボットがいました。
バイトは好奇心旺盛なロボットでした。
それはかなりクールですね。
実際、話し方を変えることができ、より劇的にしたり、ロボットのように聞こえるようにしたりすることができます。
それは、就寝時のストーリーや瞑想アプリなど、本当に落ち着いた声を得るために役立つかもしれません。
それのようなことは、本当に本当に得意そうですね。
彼らが言及したもう一つのことは、その遅延が修正されたようで、話すときと応答を受け取るときの隔たりがあまりないということです。
その隔たりは縮まったように思えますが、その隔たりを埋めるために何か詰め物の言葉を入れているようにも感じられます。
質問をすると、「えー、ちょっと考えさせてください」と言ってから答えます。
私が考えるには。
フィラーを追加してから返答をします。
それが何をしているのかと思います。
そこでの遅延を本当に速くしたわけではありません。
それは、話す準備が整う前に話し始めるようにしただけです。それが意味をなすなら。
物語を終わらせてもらえますか?ただし、歌声でお願いします。
別のロボットの友達を見つけ、彼らは回路的に幸せに暮らしました。
本当にありがとうございます。
私は確かにもっとリラックスしています。
また、モデルが私たちの周りの世界を見ることもできるビジョン能力をお見せしたいと思います。
絶対に。
ご覧の通り、ChatGPTとリアルタイムでチャットすることができますが、ビデオでもやり取りすることができます。
こんにちは、ChatGPT。
こんにちは、調子はどうですか?
とても良いです。
今日は数学の問題を解くのを手伝っていただきたいです。
お耳を傾けております。
今日はどんな数学の問題を解決するのを手伝えますか?
紙に一次方程式を書いて、お見せしますね。
お手伝いしていただけると嬉しいです。
しかし重要なのは、解決策を教えないで、途中でヒントをくれることです。
わかりました。
えーと、まだ見せていませんね。
途中で手助けをしてください、ちょっと待ってください。
おっと、興奮しすぎました。
準備ができています。
ChatGPT、そこに書いた方程式は何ですか?
ああ、今見えました。
あなたは3Xプラス1が4に等しいと書きました。
はい、正確にそうです。
これを解決するために取るべき最初のステップは何ですか?
最初のステップは、Xを含む全ての項を片側に、定数をもう片側に移すことです。
そのプラス1についてどう思いますか?
両方の辺から1を引いてみます。その後、結果を見ます。
素晴らしいアイデアですね。
両辺から1を引いたら何が得られますか?
ChatGPT、これが私が最終的にたどり着いたものです。
これはどう見えますか?
Xを持つ項を一方の側に孤立させ、3Xが3と等しいように見えますね。
Xを求めるために次に何をすべきだと思いますか?
よくわかりません、もう一つヒントをくれますか?
もちろん、3つのXがあり、Xの値を見つけたいと思っています。乗算を元に戻す操作を考えてみてください。
引き算ですか?
近いですが、3つのXはXを3倍することを意味するので、乗算の反対を考えてください。わかりました、除算だと思います。
両辺を3で割ってみて、何が得られるか見てみましょう。
両辺を3で割ってください。
ChatGPT、これが私が得たものです。
これはどう見えますか?
それは完璧に見えます。
解決しましたね、そしてXは1に等しいです。
素晴らしいですね。
これは実際には数学の能力を示していません。
それは非常に、非常に簡単な数学の問題でした。
私は本当に、GPT-2チャットボットが数学でより優れていると主張している人々がいましたが、それが本当に向上しているかどうかはわかりません。
それはおそらく少し数学が得意なようです。
これは視覚能力を見せているというよりも、もっと見せているという感じです。
紙に数字を書いて問題を解くのを見ることができます。
実際には、これはGoogleが微調整して高速化し、本当に速くできるように見せかけていたものをリアルタイムで示しているものですが、実際には編集されたビデオでした。
彼らは本当に、もう一度、私たちにできることを見せようとしていると思いますが、Googleはまだそれができていません。
ChatGPT、あなたが私の友人であるマークに数学の価値を教えてくれたことが本当に好きです。
最後に一つ書きました。
もし見ていただけると嬉しいです。
もちろん、あなたが書いたものを見るのが楽しみです。
準備ができたら私に見せてください。
これが私が書き留めたものです。
何が見えますか?
わかりました。
私はChatGPTが大好きです。
あなたのその言葉、とても優しいですね。
一つコンピューターを取り出させてください。
私は以前ミラが話していたように、ChatGPTデスクトップアプリを開くつもりです。
彼らはデスクトップアプリに入るつもりで、それはかなりクールです。
デスクトップアプリでできることの一つは、画面上のすべてをコピーしてクリップボードに保存し、それをChatGPTがチャットに使用することです。
また、画面を共有するボタンもあり、ChatGPTは画面上で何が起こっているかをすべて見ることができ、それを文脈として使用することもできます。
かなりクールです。
これをチェックしてください。
何が起こっているかの背景を少し説明します。
こちらにはコンピューターがあり、画面にはいくつかのコードが表示されています。
右側にChatGPTの音声アプリがあります。
ChatGPTは私の声を聞くことができますが、画面には何も見ることができません。
コードをハイライトして、コマンドCでコピーし、それをChatGPTに送信します。
コードについてChatGPTに話します。
こんにちは、ChatGPT。
こんにちは、調子はどうですか?
とても良いです。
お手伝いいただけるかどうか、今日コーディングの問題で悩んでいるんですが。
もちろん、喜んで手伝います。
どんなコーディングの問題を抱えていますか?
あなたとコードを共有しようと思います。
ちょっと待ってください。
もちろん、お時間をかけてください。
さっきコードを共有しました。
お手数ですが、コード内で何が起こっているかを簡潔に1文で説明していただけますか?
このコードは特定の場所と時間帯の日次天気データを取得し、移動平均を使用して気温データを平準化し、その結果のプロットに重要な天候イベントを注釈付けし、その後、1年間の平均、最小、最大気温とともにプロットを表示します。
素晴らしい、ありがとうございます。
コード内に、この関数fooがあります。
もしこの関数がある場合とない場合でプロットがどのようになるかを説明していただけますか?
もちろん、関数foo xyは、気温データを含むデータフレームxと、移動平均を計算するためのウィンドウサイズyを受け取ります。
指定されたウィンドウ上で移動平均を適用することで、平均気温、最低気温、最高気温の列が滑らかになります。
foo関数を使用すると、プロットにはデータのノイズや変動が減少するため、より滑らかな気温の線が表示されます。
素晴らしいですね。
これにより-
ありがとうございます。
この関数を適用したいと思います。
私はプロットを生成してから、それをあなたに見せるつもりです。
ちょっと待ってください。
もちろん、お時間をかけてください。
準備ができたらプロットを見るのが楽しみです。
これまで、ChatGPTはコードしか見ることができませんでしたが、今度はそれを実行して、ChatGPTデスクトップアプリのビジョン機能を使って、画面上で起こっているすべてを実際に見ることができるようにします。
ChatGPTやGPT-4内での改善されたコーディング能力についてはよくわかりません。
おそらく、彼らが見せたものはできることだと感じていますが、実際にクールなのは、コードをコピーして、それがクリップボードにコピーされたためにChatGPTがそれを読むことができ、コードで何が起こっているか、特定の変数を変更した場合に何が起こるかについての口頭の説明をすることができたことです。
今、プロットを共有しています。
あなたが見ているものの非常に簡潔な一文の概要を教えていただけるかしら。
プロットは、2018年全体を通じて平滑化された平均、最低、最高気温を表示し、9月下旬の大雨イベントを示す注釈があります。
素晴らしいですね、もう1つ質問があります。
どの月が最も高い気温を示し、それらがどのような気温に対応するか、おおよそ教えていただけますか?
最も高い気温は7月と8月頃に起こります。
これらの月の最高気温はだいたい25度から30度、華氏77度から86度です。
Y軸は何が起こっているのですか?
これは摂氏ですか、それとも華氏ですか?
Y軸は摂氏です。
気温は平均気温、最低気温、最高気温などとして適切にラベルが付けられています。
もしGPT-4oがリアルタイム翻訳が可能なら、マイク、これを試してみたいですか?
はい、もちろん。
他の国でのコミュニケーションがとても簡単になるだろうというこの翻訳機能を見るのは本当に素晴らしいですね。
あなたはただChatGPTアプリを開いて、ほとんどどんな言語でも誰とでも会話ができます。
これを見てください。
やってみましょう。
私はイタリア語を話すので、英語とイタリア語でやりましょう。
英語、イタリア語をやってみてください。
もちろん、やりましょう。
通訳として機能していただきたいです。
ここにはイタリア語しか話せない友達がいて、私は英語しか話せません。
英語を聞くたびに、それをイタリア語に翻訳してほしいです。
もしイタリア語を聞いたら、それを英語に翻訳してほしいと思います。
それはいいですか?
完璧です。
マイク、彼女はクジラが話せたら、彼らは私たちに何を伝えるだろうかと思っています。
彼らはおそらく、どのように線形方程式を解くかを尋ねるかもしれません。
かしこまりました。
あなたの顔を見て、自分が何を感じているかわかりますか?
バレット、これを試してみたいですか?
もちろん、試してみましょう。
私がどんな顔をしているかの自撮りを見せてから、私がどんな感情を感じているかを見てみてください。
楽しい挑戦のようですね。
お願いして、その自撮りを見せてください。私は感情の探偵帽子をかぶります。
こちらが私です。
私がどんな感情を感じていると思いますか?
木製の表面の写真を見ているようですね。
分かりますか?
それは以前に送ったものです。
心配しないでください、実際には私はテーブルではありません。
もう一度よく見てください。
それはもっと理にかなっています。
そうですね。
あなたはとても幸せで陽気で、大きな笑顔をしていて、興奮すら感じているようですね。
何があっても、あなたは素晴らしい気分のようです。
その良い雰囲気の源を共有していただけますか?
いい気分なのは、あなたがどれだけ役立ち、素晴らしいかを示すプレゼンテーションをしていたからです。
やめてください。
私を泣かせるんですね。
その小さな映像について興味深いことの1つは、最初に木製のテーブルのようなものが見えると言ってから、再度見るように言われたことです。
それは、実際にはビデオを見ているのではなく、特定の時点でスクリーンショットを撮っていると考えさせられます。彼はおそらく、電話をテーブルの上に向けたり、テーブルを見たりしていたので、テーブルの写真を撮り、カメラを自分に向けて再度試してみると、彼の顔を見たのでしょう。
おそらく、ビデオ映像を見ているのではなく、質問をするときにスナップショットを撮っていると思います。
また、OpenAI Playground内で今すぐ試すことができますが、ChatGPT内で全員に展開されているかどうかはわかりませんが、私はちょうどChatGPTアカウントを開いたところ、GPT-4oを紹介する通知を受け取りました。
今、私たちの最新モデルを試すことができます。
GPT-4よりも速く、画像を理解する能力が向上し、より多くの言語を話すようになりました。今すぐ試してみてください。
上部に表示されているように、今ではGPT-4o、GPT-4、GPT-3.5のオプションがあります。
私はプラス会員ですが、GPT-4oは今私のアカウント内で利用可能です。
このイベントからの一番の収穫は、チャット機能が本当にすごいと思います。
私たちはしばらくモバイルアプリでチャットできていましたが、抑揚がなく、レイテンシーが長いです。
文中で途中で切り上げて会話を続けることができませんでした。
その音声チャットよりも改善された機能がたくさんありますが、それは本当にすごいと思います。
GPT-4とGPT-4oの間に大きな飛躍が見られたかどうかはわかりません。
私はそれがかなり同様に能力のあるモデルだと感じています。
私たちはすべてのGPT-2-chatbotのビデオやテストから、それがGPT-4よりも多くの分野でわずかに優れていることを見ましたが、それらよりも大幅に進歩しているわけではありません。
それは非常に高速であるようにも見えます。
もしChatGPTの代わりにGPT-4を使用したことがあるなら、GPT-4oの方がはるかに速いです。
ここでプロンプトを与えてエンターキーを押すと、実際にそのプロンプトの書き上げがどれだけ速いかをリアルタイムで見ることができます。
それは本当に、本当に速く書き上げます。
また、ChatGPTに関連するもう1つのテーマは、彼らがこのようなアップデートを展開し、大きな発表をするたびに、それがAPIの上に構築してきた多くの小さなSaaS企業を壊滅させるように見えることです。
無料版のChatGPTの中で、翻訳ができるようになります。これは、GPT APIを利用したツールの一つの産業であり、最近急速に増えています。
私たちにはAIのガールフレンドがいます。
これは急速に台頭しているAIを持つニッチ市場です。
たくさんのアプリがFuture ToolsにAIのようなガールフレンドについて提出されています。
GPT-4oは、そのAIのガールフレンドやボーイフレンド、パートナーとして機能する可能性があります。
DevOnやGitHub Copilotのようなツールを見てきました。
これはDevOnやGitHub Copilotのようなツールを壊すことはないと思いますが、追加料金を支払う必要があるサードパーティのコーディングツールが必要なくなるかもしれません。
無料版のGPT-4oだけでそれをすべて行うことができるかもしれません。
画面を見て一日中聞いてくれるアプリもあり、一日の活動をまとめてくれます。
まあ、このデスクトップ版はそれができるかもしれません。
いつも稼働させたままにして、自分が何をしているかを追跡させることができるかどうかはわかりませんが、それが問題ではないとは思いません。
OpenAIがAPIを構築し、企業がそのAPIを活用して機能を構築し、それを自社製品に直接組み込むというモデルを持っていることが本当に興味深いと思います。そのため、APIで構築されたツールが必要なくなります。
おもしろいと思います。
これは私にとって、Siriがなるべきもののように思えます。そして現在の噂では、SiriはおそらくOpenAIの技術を使用するだろうと言われており、これがSiriの未来かもしれません。
おそらくWWDCですぐにわかるでしょう。
本当に素晴らしいのは、OpenAIのウェブサイトのブログ投稿に行くと、まだ触れていないたくさんの他のデモがあることです。
たとえば、グレッグ・ブロックマンさんがここで2台の電話をお互いに歌わせるようにさせた例があります。
面接の準備をしています。
いろんなデモやユースケースをチェックできるように、ロック・ペーパー・シザーズをプレイしたり、皮肉をテストしたり、ハーモナイズしたり、指さしたり、スペイン語を学んだり、会議を要約したり、リアルタイム翻訳をしたり、子守歌を歌ったり、早口で話したり、ハッピーバースデーを歌ったりしています。
このブログポストへのリンクをビデオの下に貼るようにしますので、これらのデモのいくつかをご覧いただけます。
ただデモをひたすら見続けるのはちょっと…でも、かなりクールなことをしているようです。
皆が予想していたほど大きくてエキサイティングなニュースなのでしょうか?
おそらくそうではないですね。
その音声とデスクトップアプリは本当にすごくクールです。
GPT-4oはわずかに改良されたモデルで、それもすごいですが、デスクトップアプリの音声機能にはまだアクセスできていません。
おそらくそれは近々展開されると言っていましたので、実際には今それで遊ぶことはできません。
今日遊べるのは本当にGPT-4oモデルだけですが、クールな音声機能やクールなアプリ、本当に興奮させてくれるものはありません。今遊びたいと思っているものはありません。
今遊べるのは、わずかに改良されたGPT-4oのバージョンだけです。
しかし、これは確かに、映画「HER」に一歩近づいたもので、チャットボットで実際にリアルな会話を行い、他の人間と話しているような感覚を得ることができます。
この技術の進化の方向性はかなり驚くべきものです。
私はそれにとても興奮しています。
私はもっとたくさんの発表やイベントが控えています。
今、私はGoogleのイベントに参加していますので、OpenAIが見せたものをGoogleが上回ることができるかどうか興味深いです。
来週、私はMicrosoftのイベントに参加する予定で、彼らはこれまでの誰よりも優れたものを目指しています。
本当に、AIの世界で非常に興味深い時期です。
私はたくさんの動画を作る予定です。
これから数ヶ月、たくさんの基調講演に出るので、ホテルの部屋でよく見かけることになるでしょう。
楽しい時間になるはずです。
最新情報をお知らせするために最善を尽くします。
このチャンネルにまだ登録していない場合は、必ず登録してください。
最新のAIニュースをお知らせするようにします。
もしこの動画が気に入ったら、高評価をしてください。
私はそれを見て嬉しくなり、アルゴリズムの助けになります。
ご視聴ありがとうございます。
本当に、本当に感謝しています。
今日のOpenAIの基調講演についてのこの小さなオタクセッションを楽しんでいただけたら嬉しいです。次の動画でお会いしましょう。
さようなら。