大規模言語モデル(LLM)やそのツールの情報整理2024.04版

ChatGPTがアカウントなしで利用可能になり、Microsoft CopilotにはGPT-4 Turboが導入された。明に禁止する組織や業務も出てきたし、使い易さで市場を少しでも取りにいく戦略かな、そういえば日本法人もできるそうだし。

そんな攻勢を仕掛けるのはClaude 3がそれだけ脅威だからか。

個人的にはPerplexityが広告を導入予定って方が驚き。有償版だけでは収益が厳しいのか、Google対抗の新時代検索エンジン候補はgoogleのSEOモデルを取り込む。個人的にはビジネスモデルが見えのと、出資元がNVIDIAとJeff Bezos(amazon)だったというので逆に安心した。

cohereはそんなに気にしてなかったけど、日本語対応の大規模言語モデル「Command R+」を出してきて話題です。
幅広い分野の多肢選択問題ベンチマーク「MMLU」で75.7%で、算数の文章題ベンチマーク「GSM8K」で70.7%。これらのベンチマークでは、トップクラスの言語モデルよりも性能が低いらしいけれど。

Meta/Facebookは、無料で商用可の最新LLM「Llama 3」を発表。このリンクにしたツイートによると性能評価としては最も優れているみたい。同じ性能ならOSSの方が良いでしょ、と競合のビジネスを無効にする後発者の戦略なのかも。

X/Twitterも出してきてるけど、

それよりはノーマークだった「Reka Core」ってのが出てきている方が気になる。GPT-4に匹敵して、マルチモーダルならClaude-3、Gemini Ultlaを超えるAIなのだとか。

一方でgoogleさん、ポリティカルコレクトネスのせいでgeminiとかはあれですけど、こういう記事を見ると相変わらずさすがと思う。4/30文脈に合う記事を入れ替えました。

個々のツールやサービスに関しては、仕事で使う情報を整理する目的もあって情報を分離し、AIのトレンド予想と具現化されるツール のページに移しました。

この記事が気に入ったらサポートをしてみませんか?