見出し画像

大規模言語モデル

ChatGPTから話題になった大規模言語モデル(LLM:Large Language Model)。簡単なプログラム作成や相談相手として手放せない存在となっている。LLMのエンジン部分であるモデルはつい最近までOpenAI社のGPT-4で十分だと思っていたが、anthropic社のClaude3 Opusが良いという話を聞きしばらくClaude3 Opusを利用していた。噂通り日本語環境ではGPT-4以上の性能が出ていそうだ。ChatGPTが出てからずっと契約しているOpenAI社のサブスクをやめてClaudeに乗り換えようとした矢先、GPT-4oという画像や音声にも適したモデルが出てきた。反応速度や返答内容もGPT-4より明らかに良くなっている。しばらくOpenAIでいいかなと思いなおしサブスク解約は思いとどまったが、anthropic社はさらにClaude3.5 Sonnetというモデルを出してきた。Claude3 Opus以上のレスポンスと性能を謳っている。他にもGoogle社のGeminiは検索との相性も良く、Meta社のLLaMAはオープンソースでカスタムができる。さらに使ったことないモデルもたくさんある。この約数ヶ月の話。2、3年後はどんな世界になっているんだろう。これまで難しかったことがいろいろできそうでアイデアが広がっていくね。

大規模言語モデルのタイムライン

A Survey of Large Language Models より引用
https://arxiv.org/pdf/2303.18223

この記事が気に入ったらサポートをしてみませんか?