【Llama3】高性能オープンソースLLMの登場で何が変わる？日本語化やGPT-4 Turboとの比較も🦙🆚

2024年4月20日 17:27

こんにちは、AIBridge Labのこばです😊
みなさん「Llama」ってご存知ですか？🦙 LlamaはMeta社が提供しているオープンソースの大規模言語モデル（LLM）です。

しかも、商用利用も可能！すごいですよね。そのLlamaシリーズに、つい先日、最新モデル「Llama3」が登場したんです。なんでも、Chatbot Arenaというユーザーの投票によるチャットボットの性能比較サイトでGPT-4やClaude3のsonnetと並ぶレベルの性能を実現しているとか…

2024/04/20時点では、Claude 3 SonnetやGemini proと並んで5位、話題のCommand R+や過去バージョンのGPT-4を超えるスコアをたたき出しています

オープンソースLLMの可能性がグンっと広がりそうな予感がします！

1.Llama3を試してみた！

というわけで、私も早速Llama3を試してみました！
Groq Chatというサービスを使えば、誰でも無料でLlama3を体験できます。

Groq Chatの詳細な説明は割愛しますが、あらゆるオープンソースLLMを無料で試せて、さらに爆速で回答を出力してくれるサービスです。

まずはGroq Chatにログインします。

ログインしたらシステムプロンプトとユーザープロンプトを入力していきます。 システムプロンプトは、Llama3にどんな役割を演じてほしいかを指示します。例えば、日本語で会話してほしいときは以下をコピーしてシステムプロンプト欄に入れてください。日本語での応答が保たれるはずです。(2024/04/22追記)

あなたは優秀な日本語を話すAIアシスタントです。これからの会話では、すべての返答を日本語で行ってください。ただし、以下の場合は例外とします。

固有名詞のように、日本語に翻訳せずにそのまま英語で表記した方が適切な単語は、英語のまま使用してください。
コードやプログラミング言語に関連する単語やフレーズは、英語のまま使用してください。
英語の方が意味が明確に伝わる専門用語や技術用語は、英語のまま使用してください。
これら以外の単語やフレーズは、必ず日本語に翻訳してください。文章全体を英語で返答することは絶対に避けてください。もし、この指示が守られていない場合は、「すべて日本語で回答してください」と言われたと思って、改めて適切な日本語での返答を行ってください。

日本語での会話を徹底するために、以下の点にも注意してください。

英語の単語を安易に使わず、必ず日本語訳があるかを確認する。
英語の言い回しや表現をそのまま日本語に置き換えない。
日本語としての自然さを重視し、必要に応じて言い換えや説明を加える。

入力したらSAVEを押せば保存されます。

ユーザープロンプトは、いわゆる質問や会話の内容ですね。

あとは、歯車マークの横にあるモデルをプルダウンからLlama3-70b-8192を選択して準備完了です。

で、実際に使ってみたんですが、応答速度が爆速すぎてびっくりしました！大体1秒から遅くても2秒くらいで返答が完了します。これが無料で使えるなんて、本当に素晴らしいですね。

2.ChatGPT4 Turboとの比較

せっかくなので、Llama3とChatGPT4 Turboの性能を比べてみました。同じ設問に対して両者の回答を並べて、その回答をClaude3 opusに、定性的・定量的に判定してもらいました。

いくつか比較した中から、推論に関する問題を例に挙げます。

【設問】
以下の状況から、登場人物の心理状態や行動の理由を推察してください。

田中さんは、会社の上司である佐藤さんから、重要なプロジェクトのリーダーに任命されました。
田中さんはこれまで、佐藤さんとあまり良好な関係を築けていませんでした。
プロジェクトの初回ミーティングで、田中さんは他のメンバーに対して、いつもよりも厳しい態度で指示を出しました。

田中さんが厳しい態度で指示を出した理由として考えられることは何ですか？
田中さんの心理状態を推察し、その理由を説明してください。
田中さんがとるべき行動として、あなたはどのような提案をしますか？

Llama3さんの回答
田中さんの心理状態についての分析は大体言っていることはGPTと似ていますが、不安による過剰な努力などリスク面にフォーカスしているように見えます。
提案の部分については、内容としては悪くはないと思いますが、2回同じことを話していて、やや冗長性を感じます。

この問題を解くためには、田中さんの心理状態を推察する必要があります。
田中さんは、佐藤さんからプロジェクトのリーダーに任命されたことになり、自分自身の能力や自信が揺らぐ可能性があります。
また、佐藤さんとの関係が良好でないため、田中さんは佐藤さんの期待に応えることを目指すかもしれません。

田中さんが厳しい態度で指示を出した理由として、以下のような推察ができます。

自分自身の能力や自信の揺らぎによる緊張感
佐藤さんの期待に応えるため、過剰な努力を示すため
プロジェクトの成功に焦点を当てるため、厳しい指示を出すことで、メンバーを鼓舞するため
田中さんの心理状態は、不安や緊張感に満ちています。彼は、プロジェクトの成功に焦点を当てるため、過剰な努力を示すことを目指しています。

私の提案として、田中さんは、プロジェクトの進捗状況を常に把握し、メンバーとのコミュニケーションを良くすることが大切です。
また、佐藤さんの期待に応えるためには、プロジェクトの進捗状況を報告することが大切です。
同時に、田中さんは、メンバーとのコミュニケーションを良くすることで、プロジェクトの成功に繋がることを目指す必要があります。

ChatGPT GPT-4 Turboさんの回答
まとめると、ChatGPTは田中さんの心理状態をいろいろな角度から分析して、それに対応する行動を提案しています。田中さんのポジティブな面は活かしつつ、リスクがある部分について指摘しているように見えますね。

田中さんが初回ミーティングで厳しい態度で指示を出した理由は、複数の心理的要因が考えられます。

証明のプレッシャー: 佐藤さんとこれまで良好な関係を築けていなかったため、田中さんはこのプロジェクトリーダーとしての任命を、自身の能力を証明する絶好の機会と捉えている可能性があります。その結果、メンバーに対して厳しく振る舞うことで、自信と決断力をアピールしようとしているかもしれません。
不安とストレス: 新しい責任の重さと、過去の関係性に基づく不安から、ストレスが高まっている状態です。このストレスが厳しい態度として表れていることがあります。田中さんはプレッシャーにより、通常よりも厳しい対応をしてしまうかもしれません。
権威の確立: プロジェクトリーダーとして、グループ内での権威を確立しようとする心理が働いている可能性もあります。特にこれまでの関係が良好でなかった上司からの任命だった場合、他のメンバーに対して自身のポジションを強く示す必要があると感じているかもしれません。

田中さんのとるべき行動の提案:

自己反省と調整: 自分の行動がどのように周りに影響を与えているかを考え、必要に応じて調整する。自分の感情やストレスの管理に努めることが重要です。
オープンなコミュニケーション: チームメンバーとの信頼関係を築くために、オープンなコミュニケーションを心がける。自分の意図やプロジェクトのビジョンをしっかりと共有し、メンバーの意見や感情に耳を傾けること。
メンタルヘルスのサポートを利用する: 必要であれば、メンタルヘルスのプロフェッショナルのサポートを求める。これにより、ストレス管理や人間関係のスキル向上に役立つかもしれません。
リーダーシップスキルの向上: リーダーシップに関する研修やセミナーに参加して、効果的なチームマネジメントやリーダーとしての振る舞いについて学ぶ。

これらの行動を通じて、田中さんは自身のリーダーシップを向上させ、プロジェクトを成功に導くことができるでしょう。

Claude3 opusの定量/定性評価の結果

回答Bの方が、設問に対してより優れた回答だと思います。

◆定量的評価:
回答Aの文字数: 約600字
回答Bの文字数: 約900字 

回答Bの方が、より詳細に分析・説明されています。

◆定性的評価:
心理状態や行動の理由の推察回答Aは、自信の揺らぎや佐藤さんの期待への応えなど、
表面的な理由を挙げているのみ。
回答Bは、証明のプレッシャー、不安とストレス、権威の確立など、より深層の心理について触れており、
詳細で説得力のある推察となっている。

推察の論理的構成回答Aは、理由を箇条書きで列挙しているだけで、論理的な流れが弱い。
回答Bは、各心理的要因を詳しく説明した上で、田中さんの行動との関連を論理的に分析している。
田中さんがとるべき行動の提案回答Aは、一般的な提案にとどまっている(プロジェクトの進捗管理、コミュニケーション改善など)。
回答Bは、自己反省、オープンなコミュニケーション、メンタルヘルスのサポート、リーダーシップスキルの向上など、より具体的かつ多角的な提案となっている。
以上の理由から、回答Bの方が、設問の要求により的確に応えた優れた回答だと評価できます。
回答Bは、心理状態の推察が深く論理的で、提案も具体的かつ実践的だと言えます。

安定のopus、割と納得感のある評価でした。

他にも大体10問ぐらいで比較してみると、確かにGPT-4 Turboの回答の方が優れているケースが多かったです。全体の8割くらいは、GPT-4の勝ちというところでしょうか。

でも、ここで注目したいのは、Llama3も十分に高精度な回答ができているってことです。オープンソースのLLMとしては、本当にすごい性能だと思います。チャットボットアリーナ5位の実力はさすがですね🦙

3.オープンソースLLMの可能性

Llama3やCommand R+などの高性能なオープンLLMの登場で、また次のフェーズに移ってきたように感じられます。無料でここまで高性能なLLMが使えるようになったことは、社会全体にとってすごく大きな意味があるだと思います。

これから、中小規模の企業や組織でも、AIの導入がグンと加速するかもしれません。コストの面で企業向けChatGPTの導入を踏みとどまっていた会社もオープンソースのLLMを活用するケースが増えると思います。

しかし、一方で自由度が高ければ高いほど倫理的な問題や法規制の議論もより重要になってくるはずです。どう使うかについては慎重に議論を進める必要がありそうですね。

4.まとめ

さて、ここまでLlama3について見てきましたが、いかがでしたか？ Llama3の登場で、これまでよりもオープンソースLLMの性能が大幅に向上したのは間違いありません。

このところオープンソースLLMの発展速度はすさまじく、ChatGPTやClaude、GeminiといったリッチなLLMの性能を追いかけるように新しいモデルがリリースされています。

特にオープンソースLLMはAIの民主化という意味で今後いろいろな分野に影響がありそうですね。
具体的には、高額なライセンス料や開発コストなしに、スタートアップや中小企業が最先端のAI技術を低コストで導入できるようになるなど。

▼さらに実践編はこちら
Ollamaを使ってLlama3をローカル環境に導入からカスタマイズまでの手順を記事にしました！

5.AIBridge Labについて

AIBridge Labは、AIの社会実装を推進するための活動を行っています。みなさんのAI活用に関する相談や質問にも、できる限りお答えしていきたいと思います。ぜひ、お気軽にお問い合わせくださいね！

お問い合わせ先は以下のメールアドレスまでお待ちしております
ai_business@doerstokyo.jp

以上、Llama3についてのレポートでした！最後までお読みいただき、ありがとうございました😊

6.無料のAI検索「Morphic」にLlama3が搭載(2024/4/22:追記)

無料版のPerplexityのようなAI検索サービス「Morphic」にもLlama3が搭載されました！AIがWEB検索を通じて、最新情報を賢く、超高速で集めてきてくれます🚀

使い方

morphic.shにアクセスして、画面右上のメニューからLoginを選択
メールアドレスかGoogleアカウントでログインができます

プロンプト入力欄の上にあるSpeedをクリックして、検索モデルを選択できます。
Lightning(Quality)を選べばLlama3を検索モデルとしたAI検索が行えます。

検索モデルとはユーザーの代わりに情報を集めてくれるアシスタントのことで、賢ければ賢いほど正確に情報を集めてきてくれます。

Groq＆Llama3-70Bなので、超高速かつ旧GPT-4を凌ぐほどの性能でWEB検索してくれるということですね。

試しに、「再生可能エネルギーにはどのような種類がありますか？各エネルギーのメリット・デメリットも合わせて教えてください。」という感じで幅広い情報検索能力と、構造化の能力がどれほどか聞いてみます。

すると2秒後には検索した情報ソースと回答がずらりと並びました。

回答は基本英語で出力されるので、翻訳するとこんな感じでした。

再生可能エネルギーの種類とメリット・デメリットとは何ですか？

再生可能エネルギーは自然に補充できるエネルギーであり、持続可能な発電方法です。 再生可能エネルギーにはいくつかの種類があり、それぞれにメリットとデメリットがあります。

再生可能エネルギーの種類:

太陽エネルギー: 太陽光発電パネルまたは太　陽熱システムを通じて太陽光線から生成されるエネルギー。
　メリット: 豊富な資源、ゼロエミッション、低メンテナンス。
　デメリット: 電源供給が断続的、初期費用が高い。

風力エネルギー: 風力タービンを使用して風から生成されるエネルギー。
　メリット: 豊富な資源、低い運用コスト、温室効果ガス排出量の削減。
　デメリット: 電源の断続、視覚的影響、騒音公害。

水力エネルギー: 川、海洋、または人工貯水池の水の動きから生成されるエネルギー。
　メリット: 高いエネルギー変換率、低い運用コスト、信頼性の高い電源供給。
　デメリット: 水資源への依存、高額な初期費用、環境への影響。

地熱エネルギー: 地球の核の熱から生成されるエネルギー。
　メリット: 安定した電源供給、低排出ガス、豊富な資源。
　デメリット: 地理的に利用できる場所が限られており、初期費用が高くなります。

バイオマスエネルギー：木材、農作物、廃棄物などの有機物から生成されるエネルギー。
　メリット：資源が豊富、廃棄物削減、低排出。
　デメリット: 食糧生産との競合、高額な初期費用、大気汚染。

水素エネルギー: 水素と酸素の反応によって生成されるエネルギー。
　メリット：ゼロエミッション、豊富な資源、高いエネルギー密度。
　デメリット: 高い生産コスト、保管と輸送の問題。

再生可能エネルギーの利点:
温室効果ガスの排出量を削減: 再生可能エネルギー源は温室効果ガスの排出量を大幅に削減し、気候変動への影響を軽減します。
エネルギーの独立性: 再生可能エネルギーは輸入化石燃料への依存を減らし、エネルギー安全保障を向上させることができます。
雇用の創出: 再生可能エネルギー業界は、製造、設置、メンテナンスの分野で新たな雇用の機会を創出しています。
大気質の改善: 再生可能エネルギーは大気汚染を軽減し、公衆衛生と生活の質を改善します。

再生可能エネルギーの課題:
断続的: 再生可能エネルギー源は常に利用できるわけではないため、エネルギー貯蔵ソリューションが必要です。
高額な初期費用: コストは減少していますが、再生可能エネルギー インフラストラクチャの設置には費用がかかる場合があります。
エネルギー貯蔵: 再生可能エネルギー源には、安定した電力供給を確保するための効果的なエネルギー貯蔵ソリューションが必要です。
インフラストラクチャー: 再生可能エネルギーを広く導入するには、送電線や貯蔵施設などのインフラストラクチャーへの多額の投資が必要です。
結論として、再生可能エネルギーは持続可能な未来に不可欠な要素であり、多くの利点と成長の機会を提供します。 克服すべき課題はありますが、再生可能エネルギーのメリットはデメリットをはるかに上回っており、よりクリーンで、より健康で、より持続可能な世界に向けた重要な一歩となっています。

いろいろな情報ソースから正確性の高い情報を集めてきてくれました。
無料で誰でも一瞬で、これだけの情報が集められるとなるとマーケティングや学習の考え方も変わっていくかもしれませんね。

さらに、この情報からの掘り下げも可能です（ほぼPerplexityそのままです）

パワーアップしたオープンソースLLMが早速いろんな製品に実装されはじめていますね！これからどうなっていくのか楽しみです。
それでは！

有料だと最高性能のAI検索ツール「Perplexity」がありますので、もし興味がある方は下の記事もご覧ください。

皆さまの温かいサポートのおかげで、活動を続けることができています。もしよろしければ、引き続き支援をお願いできますと幸いです。より質の高い記事投稿に励みます！