こへもこ

WingArc1stで働いています。AIエンジニアとプロダクトマネージャーとしての経験…

こへもこ

WingArc1stで働いています。AIエンジニアとプロダクトマネージャーとしての経験から、皆様にとって有益な記事を投稿できればと思います。

マガジン

  • ENGINEER TECH BLOG

    • 89本

    ウイングアーク1stのエンジニアによるテックブログです。 アーキテクトを担うITエンジニアメンバー(社員)が、かわるがわる「ものづくり」のナレッジやそのソース、TechのHowToを発信します。

記事一覧

生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~

はじめにはじめまして、ウイングアーク1stのこへもこと申します。 今回の記事では、大規模言語モデル(LLM: Large Language Models、以後LLM)の性能評価の裏側を紐解…

こへもこ
1か月前
31
生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~

生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~


はじめにはじめまして、ウイングアーク1stのこへもこと申します。
今回の記事では、大規模言語モデル(LLM: Large Language Models、以後LLM)の性能評価の裏側を紐解いていきたいと思います。

生成AI(Generative AI)、特にLLMの進化は目覚ましいものがあります。GPT-4o, Claude 3, Gemini 1.5, command R+など数々のモデルが

もっとみる