記事一覧
生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~
はじめにはじめまして、ウイングアーク1stのこへもこと申します。
今回の記事では、大規模言語モデル(LLM: Large Language Models、以後LLM)の性能評価の裏側を紐解いていきたいと思います。
生成AI(Generative AI)、特にLLMの進化は目覚ましいものがあります。GPT-4o, Claude 3, Gemini 1.5, command R+など数々のモデルが
はじめにはじめまして、ウイングアーク1stのこへもこと申します。
今回の記事では、大規模言語モデル(LLM: Large Language Models、以後LLM)の性能評価の裏側を紐解いていきたいと思います。
生成AI(Generative AI)、特にLLMの進化は目覚ましいものがあります。GPT-4o, Claude 3, Gemini 1.5, command R+など数々のモデルが