人気の記事一覧

MMLUデータセットとは何か: LLMの性能測定

GPT-4も苦戦!? 最新LLMベンチマーク「MMLU-Pro」についてまとめ

【論文瞬読】MMLU-Pro: 大規模言語モデルの真の能力を引き出す革新的なベンチマーク

4週間前

Dynamic Memory Compression: Retrofitting LLMs for Accelerated Inference

2か月前

Google、マルチモーダル生成AIモデル「Gemini」リリース

Air Street Capital社のState Of AI Report 2023を読む(4)

LLMのキャリブレーション:"logprob"の値が高ければ結果を信頼できるのか?

AIは、何に対して祈るのだろう?おかわり ( What does AI pray for ? Second , )