![見出し画像](https://assets.st-note.com/production/uploads/images/141088095/rectangle_large_type_2_3a229bf8cf1d2b405c49a506c8119780.png?width=800)
MMLUデータセットとは何か: LLMの性能測定
YouTubeチャンネル『Lightning Summary』(英語)において、運営側(弊社)が自主的に製作した動画の日本語原稿+αです。主にLLM関係の学術研究の紹介をします。
YouTube動画
noteで日本語記事にしていない動画もありますので、よかったらYouTubeも高評価やチャンネル登録していただけると励みになります!
MMLU
LLMのベンチマークデータセットは多数ありますが、今回はHendrycks et al. ICLR (2021)によるデータセット MMLU (Massive Multitask Language Understanding) について、原論文の内容を追う形でまとめていきたいと思います。
ここから先は
2,971字
![](https://assets.st-note.com/production/uploads/images/146937050/profile_49c8e9e8f4d40a3bc6df90557d3b9865.png?fit=bounds&format=jpeg&quality=85&width=330)
最新記事については1週間無料公開としています。
ライトニング・サマリー ブログ
100円
主にLLM論文のまとめです。YouTubeチャンネル『Lightning Summary』の動画を制作する上で整理した内容をまとめたもので…
この記事が気に入ったらサポートをしてみませんか?