MT-Bench の使い方
「MT-Bench」 の使い方をまとめました。
前回1. MT-Bench「MT-Bench」は、80の高品質でマルチターンの質問を含む、慎重にキュレーションされたLLMのベンチマークです。これらの質問は、LLMがマルチターンダイアログのモデルの会話の流れと指示に従う能力の評価を目的としており、「一般的なユースケース」と「挑戦的な指示」の両方が含まれています。
2. インストールColabでのインストール手順は、次のとおりです。
(1) パッケージのインストール。
!