見出し画像

パナソニックHDとストックマーク、国内最大規模の日本語LLM「Panasonic-LLM-100b」開発で協業

発表日:2024年7月2日

概要

パナソニック ホールディングス株式会社(以下、パナソニックHD)とストックマーク株式会社(以下、ストックマーク)は、パナソニックグループ専用の大規模言語モデル(LLM)「Panasonic-LLM-100b」の開発で協業することを発表しました。

この協業により、ストックマークが独自に開発したLLM「Stockmark-LLM-100b」に、パナソニックグループの社内データを追加学習させた「Panasonic-LLM-100b」を構築します。このLLMのモデルサイズは1,000億パラメータを予定しており、国内最大規模の企業専用LLMとなる見込みです。


取り組みの概要

今回の取り組みでは、ビジネス領域における国内最大規模の知識を学習させた「Stockmark-LLM-100b」に、パナソニックグループの社内情報を追加学習させて、専用の日本語LLM「Panasonic-LLM-100b」を構築します。

一般的な企業のLLMは70~130億パラメータの小型モデルが多い中、今回の1,000億パラメータ規模のLLMは、膨大な社内データを活用し、パナソニックHDのマルチモーダル基盤モデルへの統合を目指します。また、セキュリティ面にも配慮し、秘匿データを安全に学習する仕組みを構築予定です。

生成AIとLLMとは?

生成AI(Generative AI)は、与えられたデータをもとに新しいコンテンツを生成する人工知能技術です。これに対して、大規模言語モデル(LLM:Large Language Model)は、膨大なデータを学習し、自然言語を理解・生成するAIの一種です。最近では、企業専用のLLMを開発することで、業務効率の向上や新たな価値創出が期待されています。

大規模言語モデル(LLM)の仕組み(引用元)

「Stockmark-LLM-100b」について

「Stockmark-LLM-100b」は、経済産業省とNEDOが主催するプロジェクト「GENIAC」に採択され、2024年5月に商用利用可能な形式で公開されたLLMです。

このモデルは、1,000億パラメータ規模で、日本語・ビジネス領域に特化しており、ハルシネーションの抑制を実現しています。今回は、パナソニックHD向けに追加学習を行い、より精緻化されたモデルを提供します。


取り組みの背景

生成AIは、業務オペレーションや価値創出のあり方を根底から変えつつありますが、汎用型モデルには以下のような課題があります:

  • 利用コストの肥大化:利用量に応じて課金され、コストが増大することから、あらゆる業務に組み込むのは困難。

  • ビジネス領域における知識不足:汎用型モデルはドメイン知識が不足しており、ハルシネーションが発生しやすい。

これらの課題に対し、自社LLMの開発に取り組む企業が増えています。自社データを学習させることで、業界専門用語への対応や自社独自の知識・ノウハウをLLMに統合することが可能です。

パナソニックHDのマルチモーダル基盤モデル

「Panasonic-LLM-100b」は、パナソニックHDが開発中のマルチモーダル基盤モデルに統合され、AI開発・社会実装を加速します。

ストックマークの技術とパナソニックHDのデータ・ドメイン知識のシナジーにより、「Scalable AI」及び「Responsible AI」の実現を目指します。


まとめ

  • パナソニックHDとストックマークが協業し、国内最大規模のLLMを開発

  • 1,000億パラメータ規模のLLM「Panasonic-LLM-100b」

  • ビジネス領域に特化し、ハルシネーションを抑制

  • 自社LLM開発でコストや知識不足の課題を解決

  • マルチモーダル基盤モデルに統合し、AI活用を加速


ハッシュタグ
#AI #テクノロジー #パナソニック #ストックマーク #LLM #生成AI #ビジネス #ドメイン知識 #自社LLM


参考文献


おすすめ記事


よろしければサポートもよろしくお願いいたします.頂いたサポートは主に今後の書評執筆用のために使わせていただきます!