大規模言語モデル(LLM)やそのツールの情報整理2024.12版

Claude/Anthropicはデータ分析・視覚化ツールとかの進化で前回も取り上げたけど、ビジネス的にも広げているようで

機能としては「Model Context Protocol」、前回紹介した機能の延長線上で想像できる人もいるかもだけど、そこまでできましたかと僕は驚き。個人的にはBraveのSearch APIを使うところなんか好感度アップ

APIもプロンプトライブラリも充実してるし、日本語でも提供してるし、文書生成AIとしてはAnthropicになりつつあるなぁ

OpenAIも「ChatGPT Search」でリアルタイム検索をできるようにしてきているけれど、

そこはPerplexity AIやFeloといったサービスの方がまだ優秀なのよね

もちろんChatGPTは先行者としていろいろできるのは認めた上でです

ただビジネスの最前線においては競合はどんどん出てくる訳で

アカデミアの最先端においてもAI活用の話は出てくるわけで。googleはコッチでは今でも強いな、ビジネス側だと誤った多様性に毒されてか出力とかビミョーなことは今でもあるけど。

SLM(Small Language Models)もいろいろ出てるのでサーベイ論文を

と様々なAIが出てくると比較評価も大変になる訳で、以前もベンチマークは取り上げたけど、こちらも事実性評価とか日本語対応LLM性能評価とかいろいろ出てきた

プロンプトとかRAGとか実装テクニックの記事で面白そうなものを。

AHPを使うと評価能力が上がるって本当か試してみたくなるなww

いいなと思ったら応援しよう!