見出し画像

【Claude 3.5 超え】xAIの新型AI「Grok-2」がリリース。超高画質画像も作れる《概要、使い方、活用事例7選を徹底解説》

みなさん、こんにちは。
チャエンです!(自己紹介はこちら

Claude 3.5 SonnetとGPT-4-Turboを超えるGrok-2とGrok-2 miniを発表しました。 既にXでも利用可で、企業向けAPIも提供予定です。

𝕏での機能強化やマルチモーダル理解などにも繋がる画期的なリリースに加えて、XでFluxにて画像を作れるのは便利になるなど、今後利用機会増えそうです。

今回は、Grok-2の概要やできること、他のモデルとの比較や活用事例を紹介します。ChatGPTやClaude、Llamaに続き新しいLLMである「Grok-2」を徹底解説しますので、最後までぜひご覧ください📝

1.Grok-2の概要

Grok-2は、xAIが開発した最新の大規模言語モデルです。

2024年8月13日にGrok-2は現在X上でベータ版として提供されており、今月後半には両モデルを企業向けAPIを通じても利用可能にする予定です。

Grok-2は、X(Twitter)のリアルタイム情報と統合され、新しく表示されるGrokタブを通じて、Grok-2とGrok-2 miniの両方にアクセスすることができます。

1-1 Grokファミリーについて

最先端の推論機能を備えており、Grok-2とGrok-2 miniの2つのGrokファミリーがあります。また、両モデルにBlack Forest LabsのFLUX.1モデルを使用した画像生成機能を搭載されています。

画像生成機能FLUXについてはこちらで解説しています👇

Grok-2:以前のモデルGrok-1.5から大きく進歩し、チャット、コーディング、推論において最先端の能力を備えています。

  • xAIの最新フラッグシップモデル

  • 一部のベンチマークでGPT-4-TurboやClaude 3.5 Sonnetを上回る性能

  • 科学知識、一般知識、数学、ビジュアル推論など幅広い分野で高い能力

Grok-2 mini:Grok-2の軽量版モデルです。速度と回答の品質のバランスに優れています。

  • Grok-2と同様に高度な推論能力を持つ

  • 現在、2時間で20回の質問に制限されています。この制限を解除するにはPremium+プランへの変更が必要です。

1-2 Grokのパフォーマンスについて

Grok-2の初期バージョンは、「sus-column-r」という名前でLMSYSリーダーボードでテストされました。

Claude 3.5 SonnetとGPT-4-Turboの両方を上回る性能を示しています。

Grok-2モデルを、推論、読解力、数学、科学、コーディングを含む一連の学術的ベンチマークで評価しました。Grok-2とGrok-2 miniは両方とも、以前のGrok-1.5モデルと比較して大幅な改善を示しています。

大学院レベルの科学知識(GPQA)、一般知識(MMLU、MMLU-Pro)、数学コンテスト問題(MATH)などの分野で、他のフロンティアモデルと競争力のあるパフォーマンスレベルを達成しています。さらに、Grok-2は視覚ベースのタスクに優れており、視覚的数学推論(MathVista)や文書ベースの質問応答(DocVQA)において最先端の性能を発揮しています。

1-3 Grokの使用方法について

X(Twitter)の無料版やBasicだと使えず、Premium以上のプランで使うことができます。

2.Grok-2でできること

X(Twitter)のプランをPremium以上にすると、Grokがタブに表示されます。

ここから先は

1,972字 / 17画像
この記事のみ ¥ 800

この記事が気に入ったらサポートをしてみませんか?