見出し画像

Gemini Pro APIがリリースされる前に既存のモデルを理解しておく。

12 月 13 日より、開発者や企業は、Google AI Studio または Vertex AI の Gemini API を介して Gemini Pro にアクセスできるようになります。

Google Japan Blog: 最大かつ高性能 AI モデル、Gemini を発表 - AI をすべての人にとってより役立つものに (googleblog.com)

上記リリースに備えて、事前に既存のAIモデルを理解しておく。

Google の自社AIモデルのリスト
  • PaLM2

    • PaLM2 for Text

      • 分類、要約、エンティティ抽出などの言語タスク用モデル

    • PaLM2 for Chat 

      • チャット用モデル

      • チャット内の以前のメッセージを追跡し、それを新しいレスポンスを生成するためのコンテキストとして使用する。

  • Codey

    • Codey for Code Completion

      • コード補完用モデル

      • コードプロンプトに基づいてコードを生成する。

      • コードの提案やバグの低減に適している。

    • Codey for Code Generation 

      • コード生成用モデル

      • 自然言語の入力に基づいてコードを生成する。

    • Codey for Code Chat

      • チャットによるユーザのサポート用モデル

      • 会話を通して、APIや言語の構文など、技術的な質問に回答する。

  • Imagen

    • Imagen for Image Generation

      • テキストプロンプトから、画像を生成するためのモデル

    • Imagen for Captioning & VQA

      • 入力画像の説明を出力するためのモデル

  • Embeddings

    • Embeddings for Text

      • 入力テキストを、数ベクトルに変換するためのモデル

      • エンベディングは、セマンティック検索、レコメンデーション、テキスト分類などのタスクに有用である。

        • セマンティック検索:検索エンジンが単純なキーワードの一致検索ではなく、ユーザーの意図やクエリの意味を理解して、関連性の高い情報を提供するための技術

        • テキスト分類:学習やファインチューニングを必要とせず(ゼロショット学習)に高精度のテキスト分類を行うことが可能

    • Embeddings for Multimodal

      • 入力画像をベクトルに変換するためのモデル

  • Others

    • Sec-PaLM2

      • セキュリティ固有のタスクに関してトレーニングされたモデル

    • Chirp

      • 音声を文字に起こすためのモデル


この記事が気に入ったらサポートをしてみませんか?