MMLUデータセットとは何か: LLMの性能測定
YouTube動画
noteで日本語記事にしていない動画もありますので、よかったらYouTubeも高評価やチャンネル登録していただけると励みになります!
MMLU
LLMのベンチマークデータセットは多数ありますが、今回はHendrycks et al. ICLR (2021)によるデータセット MMLU (Massive Multitask Language Understanding) について、原論文の内容を追う形でまとめていきたいと思います。
ここから先は
2,971字
この記事が気に入ったらサポートをしてみませんか?