見出し画像

Grok-2 ・ Grok-2 mini の概要

以下の記事が面白かったので、簡単にまとめました。

Grok-2 Beta Release


1. Grok-2 ・ Grok-2 mini

「𝕏 Premium / Premium+」ユーザーは、「Grok-2」「Grok-2 mini」という2つの新しいモデルにアクセスできます。

・Grok-2 : 最先端のAIアシスタントで、テキストと視覚の両方の理解において高度な機能を備えている。
・Grok-2 mini : は、速度と回答の品質のバランスが取れた、小型ながら高性能

前モデルと比較して、「Grok-2」は、回答の検索、共同執筆、コーディング タスクの解決など、幅広いタスクにわたってより直感的で操作しやすく、多用途です。さらに、「Black Forest Labs」と協力して、「FLUX.1」を使用して、𝕏での「Grok」の機能を拡張する実験を行っています。

2. ベンチマーク

2-1 Chatbot Arena

「Grok-2」の初期バージョンは、「Chatbot Arena」で「sus-column-r」という名前でテストしています。現時点では、「Claude 3.5 Sonnet」と「GPT-4-Turbo」の両方を上回っています。

2-2. その他のベンチマーク

「Grok-2」を、推論、読解、数学、科学、コーディングを含む一連の学術ベンチマークで評価しました。「Grok-2」「Grok-2 mini」はどちらも、以前の 「Grok-1.5」に比べて大幅に改善されています。

「GPTQ」(大学院レベルの科学知識)、「MMLU」「MMLU-Pro」(一般知識)、「MATH」(数学競技問題) などの分野で、他の最先端モデルに匹敵する性能に達成しています。さらに、視覚ベースのタスクに優れており、「MathVista」(視覚的な数学推論) と「DocVQA」(ドキュメントベースの質問応答) で最先端の性能を発揮します。

3. Enterprise API

今月後半には、新しい「Enterprise API」を通じて、開発者向けに「Grok-2」「Grok-2 mini」をリリースする予定です。今後リリースされる API は、新しい特注の技術スタック上に構築されており、世界中で低遅延アクセスを実現するマルチリージョン推論の展開を可能にします。

4. 今後の予定

「Grok-2」と「Grok-2 mini」は𝕏に展開されています。検索機能の強化、𝕏投稿に関するより深い洞察の獲得返信機能の改善など、「Grok」を活用したさまざまな AI 駆動型機能への応用に非常に期待しています。近日中に、𝕏とAPI上のGrokエクスペリエンスの中核部分として、マルチモーダル理解のプレビューをリリースする予定です。



この記事が気に入ったらサポートをしてみませんか?