【3分でわかる】ChatGPT春のアップデート完全解説【GPT-4o登場】

2024年5月14日 09:39

こんにちは、長濱と申します。

普段はヨーロッパに留学しつつ、生成AIに関する話を「とにかくわかりやすく」をモットーに講演等で話している大学生です。自己紹介が長いのも好きじゃないので詳しくは下記のYouTubeで実際に講演を体験してみてください。

さて、昨日OpenAI社からChatGPTに関する【春のアップデート】の発表がありました。時間はおよそ25分間と、GoogleやAppleの発表会をイメージすると短く感じます。しかし、その内容は私たちの生活を変えてくれるようなかなり前向きな内容だったのです。まだ日本語字幕等は充実していませんので、このnoteを通じて「実際にOpenAI社は何を発表したのか」ということ。

そして、彼らは一体何を目指しているのかという点の2つに分けて解説できればと思います。というわけで、ぜひこの記事が良ければフォローやシェアのほどよろしくお願いします！^^

▼おしながきはコチラです！

01.ChatGPTをさらに多くの人へ

さて、今回の発表会の主役は【GPT-4o】という新しいモデルの紹介ですが、それ以外にも見逃せない要素がいくつかあるので、まずは先にそちらを紹介してから主役の登場と行きましょう。

OpenAI社というのは名前の通り、世界最先端のAI技術をOpenにすることで社会の治安を維持することを目標にしています。したがって、毎月1億人以上のユーザーを保有するだけでなく、さらに世界各国に広げるためにいくつかの取り組みを行うことを発表しました。

まずは制限付きではありますが、現在有料でしか扱えない最新モデル「GPT-4」を全ユーザーが使用できるようになります。今まで「実際、ChatGPTって課金する価値あるの…？」と懐疑的だったユーザーもこれからは自身の端末でその凄さを試すことができるようになります。

これに類して、自身でChatBotを作成できるサービス「GPTs」も全ユーザーが使用可能に。これまでどれだけ便利なBotを作っても共有するには有料ユーザーしかダメという制限のあったGPTsのデメリットがこれによって一気に解消されることになります。

例えば、大学の先生が自身の授業のためだけにBotを作り、その授業で活用するためだけに生徒に配布することも可能です。これにより、今までよりも格段にシェアできる範囲が広がります。

さらに、UI（ユーザーインターフェース）が刷新され、ChatGPTをサインアップ（登録）なしで使えるようにもなる予定です。細かい修正ながらもChatGPTは「かゆい所に手の届く」アップデートに定評がありますから、今回もユーザー想いの親切な修正のように見えますね。

さらに、以前よりも多くの言語に細かく対応し、日本語のトークン数も約30%減少したことによって、今までよりも多くの文字数を記憶することができます。（あくまで例えなので簡略化しますが）今まで1000文字とカウントされていたものが約714文字の扱いに。この数値を見ると大幅な記憶容量の増加が分かるでしょう。日本語を含む20カ国の言語でこの修正が入り、さらに多言語への対応が強化されていきます。

02.今回の目玉『GPT-4o』の解説

さて、間違いなく、
今回の発表会の肝である『GPT-4o』。

この章ではそんなGPT-4oは何に優れているのか、なぜ生成AIの界隈が盛り上がっているのかという疑問を解消できるように特に分かりやすく解説していきます。

【1】そもそも読み方は？
新しいAIモデルが出ると必ず巻き起こるのが「これって何と発音するんだ？」とい問題で、以前登場したGoogleのGeminiでもジェミニ派とジェミナイ派が拮抗し大変なことになりました（笑）
#結果はジェミニ派の勝利でしたが

今回のGPT-4oは（ジーピーティー・フォーオー）と読みます。したがって、後ろの4oの部分で口がウオウオ言う、何とも面白い結果になりました。（笑）私自身、最初に聞いた時は「ん？」とニヤニヤしたものです。

ちなみに、このoは「オムニ（Omni）」の頭文字で日本語だと「すべての」といった意味だそうです。以前よりもさらにテキスト・画像・音声の相互性が強まりひとつのアプリとして機能することに名が由来しているかもしれません（あくまで仮説）。

【2】まるで人間と会話しているような双方向性
今回登場したGPT-4oで世間が最も期待しているのはやはり「音声によるGPT-4oとの会話」です。

これまでもChatGPTの（主に）アプリ版では音声入力によって会話することが可能でしたが、それは人間と喋っている様子ではなくあくまで機械と会話している感じです。その原因は「音声が返ってくるまでの速度」。

通常、私たちが喋る際、頭で全て話すことを考えてから話し始めるのではなく、話しながら次に話す言葉を考えるのが僕らの脳の仕組みです。しかし、現在のアプリ版でChatGPTと会話をすると、彼らが文章を全て生成しきてからそれを朗読する形で音声が返ってきます。つまり、少しの間【ラグ】が生じてしまうのです。GPT-3なら平均2.8秒、GPT-4だと5.4秒ほどのズレが生じると言われるとかなり溝があることが分かるでしょう。

そこで、GPT-4oはこのラグを解消するべく、本当に人間と会話をしているかのようなリアルタイム性を導入。つまり、こちらが話したことに対してとりあえず喋りながら回答を考えるように。そして、ChatGPTが話している最中に私たちが割り込んで会話をしても自然になるように訓練されています。

このリアルタイム性はシンプルな要素に見えて私たちの作業や動作を色々と補助してくれるのです。例えば、通訳。

実際のデモンストレーションではイタリア語を話す女性と英語を話す男性がリアルタイムに会話をします。それはまるで人間の通訳さんが間にいるかのようなスムーズ感です。これは現状のChatGPTでは不可能でした。

また、実際のプログラミング中の画面を見せて一緒にコーディングを手伝わせることも可能になりますし、タブレット上に映された数学の問題を画面共有しGPT-4oと一緒に解くこともできます。もう正直ここまで来るとよく分かりません。（笑）

これらが実現しているのはGPT-4oがテキスト・画像・音声の情報をすべてひとつのものとして統合して処理しているという点にあります。この辺りは後ほど色々と論文も公開されるはずなので、まずは「今まで根本が少し違うことで性能が向上している」という認識でいいと思います！

これらの機能は数週間にわたって順次Plus（有料版）ユーザーに配布予定とのことで、私自身も楽しみです^^

【3】圧倒的に速い出力速度
さて、GPT-4oがすごいのは何も音声だけじゃありません。その出力速度は現状最強のモデルGPT-4と比較しても正直比べ物にならないほど早いです。これはホントに盛りなしです。。（笑）

というのも、既にPlusユーザーはGPT-4oにアクセスできるので僕も先ほどからずっと触って遊んでいるのですが、気持ちいいくらいに出力が出てきます。進撃の巨人のリヴァイとか呪術廻戦の五条悟が助けに来てくれたくらい快感です。（笑）

英語以外の言語も遥かに向上し、出力速度も大幅上昇。そして、開発者向けに公開されているAPIも料金が半額になります。

概ねこの3つを押さえていてもらえると、GPT-4oへの理解の第一歩は十分じゃないかなと思いますので、最終章である「彼らは何を目指しているのか」という未来の話に移って終わりにしたいと思います。

03.彼らは何を目指しているのか

OpenAI社の代表であるサム・アルトマン氏は度々静かに自身のブログを更新していることで有名です。（笑）ここには毎回抽象的ではあるものの、次にOpenAI社および彼が目指そうとしている未来というのが見え隠れしています。

発表会直後、サム氏は
『GPT-4o』というタイトルでブログを更新。

これによると、
彼が目指しているのは以下の2つ。

①世界最高のAIモデルを広く提供すること
②機械を人間かのように振る舞わせること

①は先にも触れたように、OpenAIという会社全体の使命ともいえます。生成AIは便利な分、人類を滅ぼすほどの危険が常につきまといますから、それらを上手に回避するために「最高の研究をオープンにしてしまって所有物化を防ぐ」というのが彼らの用いる手段です。

実際に、OpenAI社と仲の良いMicrosoft社がしきりに説明するのが「AIはCopilot（副操縦士）である」ということ。つまり、AIは人間の能力をあくまで拡張するものであり、代替するものではないという主張です。

今回の目玉であるGPT-4oがやたらと利用するのは私たちの【音声】による指示ですから、私たち人間がいなくては彼らは機能しないことを意味します。文章よりも声の方が一度に入力できる文字数が多くなるため効率も向上し、人間のポジションはあくまで一定程度守るという彼らの意志を感じます。

スターウォーズのR2-D2やC3-POのように、彼らはあくまでサポート役で困った時に助けてくれるスケットのような存在である訳です。

そして、2つ目が機械（AI）を人間のように振る舞わせることで、これは人工知能研究者のひとつのゴールでもあります。ドラえもんや鉄腕アトムはあくまで空想上の話で人類の達成できないSFだと思われています。しかし、それが達成した時、私たちは地球上で初めてひとつ別の【種】を産む動物だといえます。

彼らの目指す先はAI研究のゴールと地球および人類保全のバランスであり、その手綱を握っているリーダーとしてOpenAIは日夜AIの開発に挑んでいるのです。もちろん、彼らの方針に反対するものやAI研究の中止を呼びかける声もあります。私自身もその危険性については度々noteで触れるほどです。

しかし、その治安を守ってくれるとしたら彼らのようなトップランナーだというのも一理ありますから、私たちは動向を見守るので十分だと思います。

04.最後に

いかがでしたか？

今回のOpenAIの発表はどれもワクワクする内容が多く、今後の未来が少し見えるものでもあります。僕も定期的に生成AIについてnoteで書いているのでご興味あれば他の記事もぜひ！^^

【関連記事】

▼メルマガもやってます！ほぼ毎日3000文字のコラムが届いて月々980円です！入会は以下のリンクから！

この記事が気に入ったらサポートをしてみませんか？