こへもこ

WingArc1stで働いています。AIエンジニアとプロダクトマネージャーとしての経験…

2 フォロー 2 フォロワー

ENGINEER TECH BLOG

89本

ウイングアーク１ｓｔのエンジニアによるテックブログです。アーキテクトを担うITエンジニアメンバー（社員）が、かわるがわる「ものづくり」のナレッジやそのソース、TechのHowToを発信します。

生成AIの能力をどう評価するか？ ~激化するLLM競争を正しく見極めるために~

はじめにはじめまして、ウイングアーク１ｓｔのこへもこと申します。今回の記事では、大規模言語モデル（LLM: Large Language Models、以後LLM）の性能評価の裏側を紐解…

こへもこ

1か月前

こへもこ

2024年5月28日 15:04

生成AIの能力をどう評価するか？ ~激化するLLM競争を正しく見極めるために~

はじめにはじめまして、ウイングアーク１ｓｔのこへもこと申します。
今回の記事では、大規模言語モデル（LLM: Large Language Models、以後LLM）の性能評価の裏側を紐解いていきたいと思います。

生成AI（Generative AI）、特にLLMの進化は目覚ましいものがあります。GPT-4o, Claude 3, Gemini 1.5, command R+など数々のモデルが

もっとみる

マガジン

ENGINEER TECH BLOG

記事一覧

生成AIの能力をどう評価するか？ ~激化するLLM競争を正しく見極めるために~

生成AIの能力をどう評価するか？ ~激化するLLM競争を正しく見極めるために~