見出し画像

開発者向けにGemma 2モデルとGemini 1.5 Proの提供開始、200万トークンコンテキストウィンドウ、コード実行機能などを実装 Google

2024年6月27日、Googleは開発者向けに複数のAI機能強化を発表しました。今回のリリースでは、Gemini 1.5 Proに200万トークンのコンテキストウィンドウ、コード実行機能、そしてGemma 2モデルがGoogle AI Studioに登場しました。

従来のLLM(大規模言語モデル)は、入力可能なテキストの長さ(コンテキストウィンドウ)に限界がありましたが、Gemini 1.5 Proでは200万トークンという驚異的なコンテキストウィンドウを実現しました。これにより、膨大な情報を保持しながら、より長く複雑なテキストに対応できるようになります。また、コンテキストキャッシング機能を追加し、複数のプロンプトで同じトークンを使用する際のコスト削減も可能になりました。

Gemini 1.5 Proと1.5 Flashには、新たにコード実行機能が追加されました。LLMは従来、数学的な問題やデータ推論に苦労していましたが、この機能により、Pythonコードを生成して実行し、結果から学習することで、これらの課題に対する正確性が向上します。この機能はインターネット接続がないサンドボックス環境で動作し、開発者は生成された出力トークンに基づいて課金されます。

Google AI Studioでは、Gemma 2モデルも利用可能になりました。Gemma 2はオープンモデルとして提供されており、開発者はAPIキーを使って統合したり、実験的に利用することができます。これにより、AI技術をより多くの開発者が手軽に扱えるようになります。

Gemini 1.5 Flashは、開発者の要望に応えて高速性とコスト効率を追求したモデルです。以下のような実際の利用事例があります:

Envision: 低視力者がアプリやスマートグラスを通じて周囲の環境を理解しやすくするために利用。リアルタイムの周囲説明を提供。
Plural: NGOや政策関心者向けに、複雑な立法文書を要約し、影響力を持たせるために利用。法案成立過程の分析を支援。
Zapier: 動画から詳細情報を抽出し、Zapierテーブルに整理。動画編集の自動化を支援。
Dot: 情報圧縮タスクに利用され、ユーザーに合わせて成長するAIエージェント。長期記憶システムの効率化に貢献。
さらに、Gemini 1.5 Flashのテキストチューニング機能も開発者に向けて段階的に提供される予定です。

今回のアップデートにより、開発者はより強力なツールを使ってAIアプリケーションを構築できるようになります。詳細はGoogleのデベロッパーフォーラムやVertex AIの企業向けページで確認できます。

【引用元】

【読み上げ】
VOICEVOX 四国めたん/No.7


この記事が気に入ったらサポートをしてみませんか?