人気の記事一覧
商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開 【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当、GPT3.5やClaude v2を一部凌駕, 23/3/30時点】
優れた事例を参考にしながら独自の強みを築いて行く ベンチマーキング
304:【成長】継続していく上で大事にしてきたこと3つ!
10b程度のモデルをファインチューニングする日記 (逐次更新)
Geminiの技術レポートを読み解く〜生成AIの最前線
【論文瞬読】大規模言語モデルの自己反省能力を高める新手法「Self-Contrast」
【論文瞬読】LLMが「人の心」を理解する: 新しいベンチマークの提案
【論文瞬読】大規模言語モデルは外部情報にどう反応する?知識の矛盾への対処法を探る
【論文瞬読】エキスパートAGIの実現に向けたベンチマークの提案
【論文瞬読】言語モデルにメタ認知能力を!MetaRAGが切り拓く新たな可能性
【中級】LinuxでFF15ベンチマークを動作させる
Japanese MT-Benchの中身を見てみる
【論文瞬読】OmniACT: 自律型エージェントの汎用性評価に向けた大規模UIデータセットが登場!
【論文瞬読】マルチタスク言語理解ベンチマークMMLUの元論文を読んでみた
Japanese-StableLM-Instruction-ja_vocab_beta-7Bを試した