人気の記事一覧
商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開 【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当、GPT3.5やClaude v2を一部凌駕, 23/3/30時点】
304:【成長】継続していく上で大事にしてきたこと3つ!
10b程度のモデルをファインチューニングする日記 (逐次更新)
優れた事例を参考にしながら独自の強みを築いて行く #63 ベンチマーキング
【論文瞬読】マルチモーダルAIの最前線:大規模言語モデルにおけるHallucinationの課題と展望
【論文瞬読】複数のAIモデルを組み合わせて評価!大規模言語モデルの新しい評価手法「PoLL」とは?
ブルームバーグが構築した世界30都市を対象にしたデータダッシュボード
【論文瞬読】LLMが「人の心」を理解する: 新しいベンチマークの提案
Geminiの技術レポートを読み解く〜生成AIの最前線
【論文瞬読】大規模言語モデルの自己反省能力を高める新手法「Self-Contrast」
【中級】LinuxでFF15ベンチマークを動作させる
【論文瞬読】大規模言語モデルの算術推論能力を適切に評価する新手法-ベンチマークデータの汚染と過学習の問題に迫る-
【論文瞬読】大規模言語モデルは外部情報にどう反応する?知識の矛盾への対処法を探る
【論文瞬読】エキスパートAGIの実現に向けたベンチマークの提案
【論文瞬読】言語モデルにメタ認知能力を!MetaRAGが切り拓く新たな可能性
【論文瞬読】オープンソースの評価言語モデル「PROMETHEUS 2」登場!複数の評価方式に対応し、人間レベルの評価を実現
2030年のLLMのベンチマークはどうなるんだろうか