「#人間評価」の人気タグ記事一覧｜note ――つくる、つながる、とどける。

ConSiDERS-The-Human Evaluation Framework: Rethinking Human Evaluation for Generative Large Language Models

2週間前

MEDVOC: Vocabulary Adaptation for Fine-tuning Pre-trained Language Models on Medical Text Summarization

1か月前

UltraEval: A Lightweight Platform for Flexible and Comprehensive Evaluation for LLMs

2か月前