大規模言語モデル(LLM)やそのツールの情報整理2024.12版
Claude/Anthropicはデータ分析・視覚化ツールとかの進化で前回も取り上げたけど、ビジネス的にも広げているようで
機能としては「Model Context Protocol」、前回紹介した機能の延長線上で想像できる人もいるかもだけど、そこまでできましたかと僕は驚き。個人的にはBraveのSearch APIを使うところなんか好感度アップ
APIもプロンプトライブラリも充実してるし、日本語でも提供してるし、文書生成AIとしてはAnthropicになりつつあるなぁ
OpenAIも「ChatGPT Search」でリアルタイム検索をできるようにしてきているけれど、
そこはPerplexity AIやFeloといったサービスの方がまだ優秀なのよね
もちろんChatGPTは先行者としていろいろできるのは認めた上でです
ただビジネスの最前線においては競合はどんどん出てくる訳で
アカデミアの最先端においてもAI活用の話は出てくるわけで。googleはコッチでは今でも強いな、ビジネス側だと誤った多様性に毒されてか出力とかビミョーなことは今でもあるけど。
SLM(Small Language Models)もいろいろ出てるのでサーベイ論文を
と様々なAIが出てくると比較評価も大変になる訳で、以前もベンチマークは取り上げたけど、こちらも事実性評価とか日本語対応LLM性能評価とかいろいろ出てきた
プロンプトとかRAGとか実装テクニックの記事で面白そうなものを。
AHPを使うと評価能力が上がるって本当か試してみたくなるなww