はじめに
Wikipediaによると、Mistral AIはAI製品を販売するフランスの企業で、2023年4月にMeta PlatformsとGoogle DeepMindの元従業員によって設立されたそうです。2023年10月には3億8500万ユーロの資金を調達し、12月には20億ドル以上の価値があると評価されました。
Mistral AIは、オープンソースモデルと商用モデルの両方を提供しています。オープンソースモデルは、AIコミュニティが自由に利用できるようにApache 2.0ライセンスの下で提供されています。以下に公式サイトで紹介されている3つのオープンソースモデルを確認してみます。
Mistral 7B
7B
英語とコードで高性能
コンテキストウィンドウ:32k
Mixtral 8x7B
Mixtral 8x22B
22B SMoE(全体の141Bのうち39Bのアクティブパラメータを使用)
英語、フランス語、イタリア語、ドイツ語、スペイン語が流暢で、コードにも強い
コンテキストウィンドウ:64k
ネイティブ関数呼び出し機能
APIエンドポイントでの関数呼び出しとJSONモードが利用可能
どのモデルも日本語が得意とは書かれていませんが、実際どのくらい日本語ができるのか、調査してみたいと思います。
elyza/ELYZA-tasks-100からいくつかの質問を試してみたいと思います。プロンプトは特に工夫せず、問題がある場合は少し変更を加えてみたいと思います。
Mistral 7B
質問(1)
日本語で回答することは出来ていますが、英語が混じっていたり、不自然な日本語になっているところがあります。
質問(2)
不自然な日本語になっていて、回答も間違えてしまっています。
質問(3)
英語で回答してしまっており、内容も間違えています。
「必ず日本語で回答してください。」とプロンプトに追加してみました。
日本語で回答することは出来ていますが、不自然な日本語になるっていますし、回答も間違えています。
Mixtral 8x7B
質問(1)
日本語で回答することは出来ていますが、英語や韓国語や記号が混じっていて、Mistral-7Bよりも読みづらかったです。
質問(2)
内容は良かったのですが、英語で回答してきてしまっています。
「必ず日本語で回答してください。」とプロンプトに追加してみました。
日本語で回答することは出来ていますが、英語が混じってしまいました。内容は悪くないと思いました。
質問(3)
こちらも内容は良かったのですが、英語で回答してきてしまっています。
「必ず日本語で回答してください。」とプロンプトに追加してみました。
日本語で回答することは出来ていますが、英語が混じってしまいました。内容が悪化して回答も間違えています。
Mixtral 8x22B
質問(1)
Mistral-7BやMixtral-8x22Bに比べると自然な日本語で回答出来ています。内容も具体的で実用的なアイデアを提供しています。
質問(2)
自然な日本語で回答出来ています。内容も良いと思いました。
質問(3)
自然な日本語で回答出来ています。しかしながら、内容は少し間違えてしまっています。
まとめ
Mistral AIの3つの異なるモデル(Mistral 7B、Mixtral 8x7B、Mixtral 8x22B)を使って、日本語での質問応答能力をテストしました。結果として、特にMixtral 8x22Bモデルが比較的に自然な日本語で回答を行うことができ、内容も一貫性がありました。一方、Mistral 7BとMixtral 8x7Bは、時折英語や他の言語が混じるなど、日本語の生成に若干の問題を抱えていることが明らかになりました。