Google、次世代のオープンモデル「Gemma 2」などGemini ファミリー モデル全体に一連のアップデートを発表
Googleは、AIモデル「Gemini」シリーズに画期的なアップデートを導入しました。新しいモデル「Gemini 1.5 Flash」は、スピードと効率性を追求し、より軽量かつ迅速な処理を実現しています。また、AIアシスタントのビジョンを具現化する「Project Astra」も進行中です。
昨年12月に公開された初のネイティブマルチモーダルモデル「Gemini 1.0」は、Ultra、Pro、Nanoの3種類のサイズで登場し、その後「Gemini 1.5 Pro」も発表されました。このモデルは、パフォーマンスを強化し、100万トークンのロングコンテキストウィンドウを持つことで高い評価を受けています。
新たに発表された「Gemini 1.5 Flash」は、1.5 Proよりも軽量でありながら、大規模なタスクに高速かつ効率的に対応できるモデルです。これにより、低いレイテンシとコスト効率が求められるアプリケーションでの利用が期待されます。Flashモデルは、要約、チャットアプリケーション、画像や動画のキャプション作成、長文や表からのデータ抽出に特化しています。1.5 Flashは、Google AI StudioとVertex AIで提供されており、100万トークンのコンテキストウィンドウを備えています。
さらに、1.5 Proも大幅に改良され、コンテキストウィンドウは200万トークンに拡張されました。また、データとアルゴリズムの進歩により、コード生成、論理的推論、マルチターン会話、音声と画像の理解が強化されています。このモデルは、複雑で微妙な指示にも従うことができ、特定のユースケースに対するモデルの応答制御が改善されています。
「Gemini Nano」は、テキスト入力だけでなく画像も含めるように拡張されました。これにより、視覚、聴覚、話し言葉を通じて人間と同じように世界を理解できるマルチモーダルなアプリケーションが可能になります。まずはGoogle Pixelに向けて提供される予定です。
次世代のオープンモデル「Gemma 2」も発表されました。Gemma 2は、新たなアーキテクチャを備え、画期的なパフォーマンスと効率を実現します。また、ビジョン言語モデル「PaliGemma」も導入され、モデル応答の品質評価のためのツールキットがアップグレードされました。
「Project Astra」は、AIアシスタントの未来を見据えた開発プロジェクトで、複雑でダイナミックな世界を人間のように理解し、自然な会話を可能にすることを目指しています。Googleは、音声モデルを活用し、リアルタイムでの応答性を高めるための技術開発を進めています。
これらの進化により、GoogleはAI技術の最前線を走り続け、未来のAIアシスタントの実現に向けた大きな一歩を踏み出しています。
詳細内容は、Googleが提供する元記事を参照してください。
【引用元】
【読み上げ】
VOICEVOX 四国めたん/No.7