見出し画像

GPT-4oのスピードと精度に驚愕!これからのLLM活用と未来

みなさんこんにちは!
ワンキャリアの(データサイエンティスト)兼マーケターの長谷川(GitHub:@tyuyoshi)です!

本記事では、先日OpenAIから発表された新モデル「GPT-4o」について、従来の「GPT-4」と比較していきたいと思います。GPT-4oは計算速度が驚異的に向上したと、かなり話題になっていますよね。とはいえ、実際のパフォーマンスはどうなのでしょうか?今回は文章生成と画像認識、そして計算速度の3つの側面から、検証していきます。



GPT-4oってどんなモデル?

GPT-4oは、GPT-4と同じ大規模言語モデルですが、以下のような特徴※1があります。

・GPT-4のときは、音声入力から出力までの遅延は平均5.4秒だった一方で、GPT-4oでは大幅に短縮されており、人間との会話に近い232ミリ秒から平均320ミリ秒の高速な応答が可能。

・GPT-4oは、テキスト・視覚・音声を組み合わせてエンドツーエンドで訓練されています。GPT-4では個別のモデルをパイプラインで連結していたが、単一のモデルになったことで、テキスト・音声・画像・動画のあらゆる組み合わせを入力として受け取り、テキスト・音声・画像のあらゆる組み合わせを出力できる。

・様々な言語での評価、並びに画像を用いた視覚評価を組み合わせたM3Examにおいて、全ての言語でGPT-4を上回る。

・70以上の外部専門家から安全性評価を獲得しており、サイバーセキュリティ・説得力・自律性などの面でリスクは低減している。

※1. 引用:「Hello GPT-4o | OpenAI」(アクセス日:2024年5月23日)

中でも1つ目の「推論速度の向上」は、リアルタイムで応答が必要なアプリケーション活用において大いに期待されており、AI開発の追い風になりそうですね。
では、実際のタスクでどのようなパフォーマンスを見せてくれるのか、詳しく見ていきましょう!


GPT-4o vs GPT-4 Turbo バトル1:文章生成

はじめは、文章生成のタスクから。日本語の長文を生成するタスクで、GPT-4oとGPT-4 Turboを戦わせてみました。

お題:「人工知能が社会に与える影響について」800字程度で論じてください。

<GPT-4 Turboの生成結果:1,125文字>

人工知能(AI)の進化は、社会に多大な影響を与えています。その影響は、労働市場の変化から、
日常生活の質の向上、さらには倫理的な問題の提起に至るまで、多岐にわたります。
本稿では、これらの影響について概観し、今後の展望について考察します。
まず、労働市場におけるAIの影響から見てみましょう。AI技術の発展により、自動化が進んでいます。
これにより、製造業をはじめとする多くの分野で、人間による作業がAIに置き換わることが予想されます。
一方で、AIは新たな職業の創出も促しています。
例えば、AIの開発や管理、AIを活用した新サービスの提供などが挙げられます。
このように、AIは一部の職種をなくす可能性がある一方で、新たな雇用機会を生み出す可能性も秘めています。
次に、日常生活への影響です。AIは、スマートフォンのアシスタント機能から、家庭内のスマートデバイス、
医療や教育などの分野に至るまで、私たちの生活を便利にしています。例えば、AIを活用した健康管理アプリは、
個人の健康状態をモニタリングし、適切な運動や食事を提案してくれます。
また、オンライン教育では、AIが学習者の理解度を分析し、個々に合わせた学習プログラムを提供することで、
より効果的な学習が可能になっています。
しかし、AIの社会への影響は、必ずしも肯定的なものばかりではありません。
プライバシーの侵害やセキュリティの問題、さらにはAIによる意思決定の透明性や公正性に関する懸念が
指摘されています。例えば、顔認識技術の普及により、個人のプライバシーが侵害される可能性があります。
また、AIが人種や性別などに偏った判断をすることで、社会的な不平等を助長する恐れもあります。
これらの問題に対処するためには、技術の発展と同時に、倫理的なガイドラインの策定や法的な枠組みの整備が求められます。
AIの開発者や利用者は、技術の影響を十分に考慮し、社会的な責任を果たす必要があります。
最後に、AIの未来について考えてみましょう。AI技術は今後も進化を続け、その影響はさらに拡大することが予想されます。
この技術革新がもたらす機会を最大限に活用するためには、技術的な側面だけでなく、社会的、倫理的な側面にも
目を向けることが重要です。人間とAIが共存する社会を実現するためには、AIの持つ可能性を引き出しつつ、
そのリスクを適切に管理するバランスが求められます。
結論として、AIは社会に多大な影響を与えており、その影響は今後も拡大することが予想されます。
AIの持つ可能性を最大限に活用するためには、技術的な進歩と同時に、社会的、倫理的な課題に対する意識を高め、
適切な対策を講じることが不可欠です。

<GPT-4oの生成結果:1,264文字>

人工知能(AI)は、現代社会において急速に進化し、その影響は多岐にわたる。
AIの進展は、経済、医療、教育、交通、エンターテインメントなど、
さまざまな分野において革新的な変化をもたらしている。以下に、AIが社会に与える影響について論じる。
まず、経済における影響について考えると、AIは生産性の向上と新たなビジネスモデルの創出に寄与している。
例えば、製造業ではロボットとAIを組み合わせた自動化が進み、人間の手を借りずに高精度な製品を
大量生産することが可能となった。また、金融業界ではAIを用いたアルゴリズム取引やリスク管理が普及し、
効率的な資産運用が実現されている。しかし、一方でAIの導入により一部の職業が自動化され、
失業のリスクが高まるという懸念もある。特に単純作業やルーチンワークが中心の職業は、
AIによって代替される可能性が高い。
次に、医療分野におけるAIの影響について述べる。AIは診断や治療の精度を向上させるツールとして
期待されている。例えば、画像認識技術を用いたAIは、医師が見逃しがちな微細な病変を検出することができる。
また、AIを活用した予測モデルは、患者の病状の進行を予測し、最適な治療法を提案することが可能である。
これにより、医療の質が向上し、患者の生存率が高まることが期待される。
しかし、AIの導入にはデータのプライバシーや倫理的な問題も伴うため、慎重な対応が求められる。
教育分野においても、AIは大きな変革をもたらしている。AIを活用した個別指導システムは、
生徒一人ひとりの学習進度や理解度に応じたカスタマイズされた教育を提供することができる。
これにより、学習効率が向上し、教育の質が全体的に向上することが期待される。
また、AIを用いた言語学習アプリやオンラインコースは、地理的な制約を超えて教育の機会を広げる役割を
果たしている。交通分野では、自動運転技術が注目されている。
AIを搭載した自動運転車は、交通事故の減少や交通渋滞の緩和に寄与する可能性がある。
特に高齢者や障害者にとっては、自動運転車が移動の自由を提供し、生活の質を向上させる手段となる。
しかし、自動運転技術の普及には法整備や社会的受容が必要であり、技術的な課題も残されている。
最後に、エンターテインメント分野におけるAIの影響について触れる。AIは映画や音楽の制作、
ゲームの開発などにおいて新たな創造性を引き出すツールとして活用されている。
例えば、AIを用いた音楽生成プログラムは、作曲家が思いもよらないメロディを生み出すことができる。
また、AIを活用したゲームは、プレイヤーの行動を学習し、よりリアルでダイナミックな体験を提供することが
可能である。総じて、AIは社会に多大な恩恵をもたらす一方で、倫理的、法的、社会的な課題も存在する。
AIの進化を最大限に活用するためには、これらの課題に対する適切な対応が求められる。
社会全体でAIの利点とリスクをバランスよく考慮し、持続可能な未来を築くための取り組みが必要である。

どちらも論理的でわかりやすい文章を生成できていますね。ただ、どちらも字数は大幅オーバーです...。プロンプトによる文字数の制御はまだ難しいのかもしれません。内容面でもあまり遜色はないようですが、GPT-4oの方がより社会実装に向けた具体的な論調になっており、倫理面への言及もより積極的にしている印象です!


GPT-4o vs GPT-4 Turbo バトル2:画像認識対決

次は、画像認識性能を見てみましょう。2つのモデルに同じ犬の画像を見せて、ド直球の質問をぶつけてみました。

質問画像(犬の写真):「この画像に写ってるワンちゃんの犬種は何でしょう?」
正解は「ハスキー犬」です!

<GPT-4 Turbo with Visionの回答>

この画像に写っている犬種はシベリアン・ハスキーです。

<GPT-4oの回答>

この画像に写っている犬は、シベリアン・ハスキー(Siberian Husky)です。
シベリアン・ハスキーは、特徴的な青い目や厚い被毛、立ち耳が特徴の犬種です。

画像認識能力自体は両者に目立った違いはないよう。ただGPT-4oの方が、シベリアン・ハスキーの具体的な容姿の特徴や英語表記にまで言及しており、より親切な説明になっているなという印象でした。


GPT-4o vs GPT-4 Turbo バトル3:計算速度

最後は注目の計算速度で戦わせてみます。1つ目の文章生成のタスク(800字の文章生成)にかかる時間を計測してみると以下の結果になりました。

・GPT-4o:約29.25秒
・GPT-4 Turbo:約45.28秒

GPT-4oは、GPT-4 Turboの1.5倍近い速度で処理を完了させていますね。膨大な計算リソースを要する大規模言語モデルでこれだけの速度改善が実現できたのは、画期的だと感じました。

この高速化によってリアルタイム性が求められるアプリケーションへの応用の幅がぐっと広がりそうですね。特にユーザーとのインタラクションを伴うシステムなどは、レスポンスの速さが体験価値に直結する重要なポイントになります。GPT-4oであれば、よりストレスのないやり取りが実現できるのでは無いでしょうか。

まとめ:GPT-4oの登場で、AI界はどう変わる?

本テックブログでは、GPT-4oとGPT-4 Turboを比較してきました。
文章生成と画像認識の性能では大差はなかったですね。(個人的にはGPT-4oのレスポンスが好きでしたw)

一方で計算速度は、GPT-4oが圧倒的に速かったですね!
音声に関してはまだ比較できませんが、同じ性能より高速で実現できるGPT-4oは、リアルタイム性が重視されるアプリケーションとの活用に期待できそうです。
言語処理系のタスク全般で、めちゃくちゃ大きな進歩をもたらしてくれるのではないでしょうか。

今回の記事はどうだったでしょうか?
GPT-4oのリリースをきっかけに、言語AIの可能性がどんどん広がっていくのが楽しみですね!ワンキャリアでも積極的に活用していきたいと考えてます!

▼ワンキャリアのエンジニア組織のことを知りたい方はまずこちら

▼カジュアル面談を希望の方はこちら

▼エンジニア求人票


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?