書籍「ChatGPTエフェクト 破壊と創造のすべて」の作中に登場する「少ないデータで作られた精緻なモデルは、大量のデータで構築した簡易なモデルに駆逐される」というフレーズ。ヒーローが大技を繰り出した後に呟きそうなキメ台詞だが、出典論文が書いてなかったから調べておいた。
原文では
「しかし常に、大量のデータで構築した簡易なモデルは少ないデータで作られた精緻なモデルに勝る」と記載されている。
2009年3月に Google の Alon Halevy, Peter Norvig, Fernando Pereira による論文で IEEE Intelligent Systems に掲載された。自然言語処理におけるラベルなしの大量データから高品質の言語モデルを構築できる、としている。
これで論文筆者の Alon Halevy、 Peter Norvig、 Fernando Pereira の経歴や研究内容を追うのも簡単になるだろう。