こへもこ

WingArc1stで働いています。AIエンジニアとプロダクトマネージャーとしての経験…

こへもこ

WingArc1stで働いています。AIエンジニアとプロダクトマネージャーとしての経験から、皆様にとって有益な記事を投稿できればと思います。

マガジン

  • ENGINEER TECH BLOG

    • 86本

    ウイングアーク1stのエンジニアによるテックブログです。 アーキテクトを担うITエンジニアメンバー(社員)が、かわるがわる「ものづくり」のナレッジやそのソース、TechのHowToを発信します。

最近の記事

生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~

はじめにはじめまして、ウイングアーク1stのこへもこと申します。 今回の記事では、大規模言語モデル(LLM: Large Language Models、以後LLM)の性能評価の裏側を紐解いていきたいと思います。 生成AI(Generative AI)、特にLLMの進化は目覚ましいものがあります。GPT-4o, Claude 3, Gemini 1.5, command R+など数々のモデルが登場し、その驚異的な能力により、自然言語処理(NLP)の分野だけでなく、多くの産

    生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~

      マガジン

      • ENGINEER TECH BLOG
        86本