見出し画像

イーロンマスクが発表した「Grok-2」と「Grok-2 mini」



皆さんこんにちは!

イーロン・マスクが率いるxAIが、新しいAIモデル「Grok-2」の
早期プレビュー版をリリースしました。

Grok-2の概要

Grok-2は、xAIによって開発された最新のAIモデルで、前モデルのGrok-1.5から大幅に進化しました。
この新モデルは、チャットコーディング推論の各機能が強化されており、特に視覚的なタスクにおいて優れた性能を発揮します。
Grok‐2の大きな特徴は、他のAIツールでは回答を拒否してしまうような難しい質問にも柔軟に対応できること。
そして、xAIのプラットフォームから収集した最新情報を活用できるのが魅力です。

Grok-2とGrok-2 miniの導入

Grok-2とその小型版であるGrok-2 mini同時に発表されました。
Grok-2 miniは、速度と回答の品質のバランスが取れた、小型ながら高性能なモデルです。
これらのモデルは現在、𝕏(旧Twitter)のプレミアムユーザー向けにベータ版として提供されています。
X PremiumおよびPremium+ユーザーは、Grokタブから利用できます
 

XのGrokタブ

パフォーマンスと評価

Grok-2の初期バージョンは「sus-column-r」という名称でLMSYSリーダーボードでテストされ、Claude 3.5 SonnetやGPT-4-Turboを上回る成績を記録しました。
また、LMSYSチャットボットアリーナでの総合Eloスコアでも優れた結果を示しています。
AIチューターが、様々なタスクでGrok-2と対話を行い、指示に従う能力や正確な情報提供能力を評価した結果、Grok-2は大幅な進歩を示しました。
特に、取得したコンテンツを理解し、推論する能力、欠落している情報を正しく特定する能力、一連のイベントを推論する能力、無関係な投稿を削除する能力などにおいて、顕著な改善が見られました。

Grok-2の気になる特徴


Grok-2の大きな特徴は、他のAIツールでは回答を拒否してしまうような難しい質問にも柔軟に対応できること。
そして、xAIのプラットフォームから収集した最新情報を活用できるのが魅力です。
しかし、気になる点もあります。
画像を生成された複数のレビューによると、Grok-2では政治家の画像を生成することが可能なようです。
多くの画像生成ツールでは政治家の肖像画作成に制限を設けているのに対し、Grok-2にはそうした制限がないのが気懸かりです。

そのままでは、Grok-2が誤情報を生み出すツールとして悪用される可能性があるため、開発元のxAIには早急な対応が求められそうです。
また、Grok‐2で生成された画像データにAI生成であることを示すメタデータが含まれているかどうかも不明です。

今後の動向に注目が集まっています。Grok‐2の優れた機能と懸念される側面、両面を見守っていく必要がありそうです。

まとめ


Grok-2の主なポイント:

  1. xAIは、チャット、コーディング、推論において進化したAIモデル「Grok-2」をリリース。

  2. Grok-2は、LMSYSリーダーボードでトップを独走し、学術的なベンチマークでも高い評価を得ている。

  3. XプラットフォームユーザーはGrok-2と小型版のGrok-2 miniを利用可能。

  4. 今月下旬には、開発者向けにエンタープライズAPIを通じてGrok-2を提供予定。

  5. xAIは、Grokをさらに進化させ、マルチモーダル理解機能を追加する予定。

この記事が気に入ったらサポートをしてみませんか?