見出し画像

Command R の 概要

以下の記事が面白かったので、簡単にまとめました。

Command R: Retrieval-Augmented Generation at Production Scale


1. Command R

Command R」は、「RAG」や「Tool」などの長いコンテキストタスク向けに最適化されたLLMです。CohereのEmbeddingおよびRerankと連携して動作するように設計されており、RAGアプリケーションに最高クラスの統合を提供し、エンタープライズユース ケースで優れています。

特徴は、次のとおりです。

・RAGとToolの使用に関する高い精度
・低遅延、高スループット
・128Kコンテキスト長、価格が安い
・10の主要言語に対応 (日本語含む)
・研究・評価のために
HuggingFaceでウェイトを公開

「Command R」は、Cohere のホスト型APIですぐに利用できるようになり、近い将来、主要なクラウドプロバイダーでも利用できるようになります。

2. RAG

「RAG」は、LLM の導入において重要なパターンとなっています。モデルにプライベートデータベースを検索させ、その情報を使用して応答を生成することで、モデルの精度と有用性が劇的に変化します。

「RAG」の主要コンポーネントは次のとおりです。

2-1. Retrieval (検索)

Retrieval」(検索)は、ユーザーへの応答に関連する情報のコーパスを検索するコンポーネントです。

CohereのEmbedingモデルは、数百万、数十億のドキュメントを検索する際のコンテキストと意味の理解を向上させることで、検索ステップの有用性と精度を大幅に向上させます。CohereのRerankモデルは、取得した情報の価値をさらに向上させ、関連性やパーソナライゼーションなどのカスタム指標全体で結果を最適化します。

2-2. Augmented Generation (拡張生成)

Augmented Generation」(拡張生成)は、 取得した情報を使用して、より多くの情報に基づいた応答を生成するコンポーネントです。

関連性の高い情報が特定されると、「Command R」はその情報を要約、分析、パッケージ化して、従業員の生産性を向上させたり、新しいエクスペリエンスを生み出すために活用したりすることができます。「Command R」に特有の、モデ​​ルの出力には明確な引用が付属しており、幻覚のリスクを軽減し、ソース資料から追加のコンテキストを明らかにすることができます。

3. Tool

LLMは、テキストを取り込んで生成する単なるマシンではなく、タスクを自動化し、アクションを実行できる中核となる推論エンジンである必要があります。「Command R」は、モデルが高度なタスクを自動化できるようにするコードインタープリタやその他のユーザー定義ツールなどのツール (API) を使用する機能によってこれを実現します。

「Tool」を使用すると、企業の開発者は「Command R」を、データベースやソフトウェア ツールなどの内部インフラストラクチャだけでなく、CRM、検索エンジンなどの外部ツールの使用を必要とするタスクやワークフローの自動化を強化するエンジンに変えることができます。これにより、複数のシステムにまたがり、複雑な推論と意思決定を必要とする、時間のかかる手動タスクの自動化が可能になります。

ツールの使用は API 経由で利用できるようになりました。詳しくはこちらを参照してください。

4. 多言語対応

「Command R」は、グローバルビジネスの主要10言語 (英語、フランス語、スペイン語、イタリア語、ドイツ語、ポルトガル語、日本語、韓国語、アラビア語、中国語) に優れています。さらに、EmbeddingモデルとRerankモデルは100 以上の言語をネイティブに提供します。

5. コンテキスト長と価格の改善

「Command R」はコンテキスト長が長くなり、初期リリースでは最大 128,000トークンをサポートします。このアップグレードには、Cohereのホスト型APIの価格引き下げと、Cohereのプライベートクラウドデプロイメントの効率の大幅な向上も含まれます。「Command R」は、より長いコンテキスト長と低価格の価格を組み合わせることで、劇的なパフォーマンスの向上をもたらすRAGユース ケースを可能にします。



この記事が気に入ったらサポートをしてみませんか?