パナソニックHDとストックマーク、国内最大規模の日本語LLM「Panasonic-LLM-100b」開発で協業
発表日:2024年7月2日
概要
パナソニック ホールディングス株式会社(以下、パナソニックHD)とストックマーク株式会社(以下、ストックマーク)は、パナソニックグループ専用の大規模言語モデル(LLM)「Panasonic-LLM-100b」の開発で協業することを発表しました。
この協業により、ストックマークが独自に開発したLLM「Stockmark-LLM-100b」に、パナソニックグループの社内データを追加学習させた「Panasonic-LLM-100b」を構築します。このLLMのモデルサイズは1,000億パラメータを予定しており、国内最大規模の企業専用LLMとなる見込みです。
取り組みの概要
今回の取り組みでは、ビジネス領域における国内最大規模の知識を学習させた「Stockmark-LLM-100b」に、パナソニックグループの社内情報を追加学習させて、専用の日本語LLM「Panasonic-LLM-100b」を構築します。
一般的な企業のLLMは70~130億パラメータの小型モデルが多い中、今回の1,000億パラメータ規模のLLMは、膨大な社内データを活用し、パナソニックHDのマルチモーダル基盤モデルへの統合を目指します。また、セキュリティ面にも配慮し、秘匿データを安全に学習する仕組みを構築予定です。
生成AIとLLMとは?
生成AI(Generative AI)は、与えられたデータをもとに新しいコンテンツを生成する人工知能技術です。これに対して、大規模言語モデル(LLM:Large Language Model)は、膨大なデータを学習し、自然言語を理解・生成するAIの一種です。最近では、企業専用のLLMを開発することで、業務効率の向上や新たな価値創出が期待されています。
「Stockmark-LLM-100b」について
「Stockmark-LLM-100b」は、経済産業省とNEDOが主催するプロジェクト「GENIAC」に採択され、2024年5月に商用利用可能な形式で公開されたLLMです。
このモデルは、1,000億パラメータ規模で、日本語・ビジネス領域に特化しており、ハルシネーションの抑制を実現しています。今回は、パナソニックHD向けに追加学習を行い、より精緻化されたモデルを提供します。
取り組みの背景
生成AIは、業務オペレーションや価値創出のあり方を根底から変えつつありますが、汎用型モデルには以下のような課題があります:
利用コストの肥大化:利用量に応じて課金され、コストが増大することから、あらゆる業務に組み込むのは困難。
ビジネス領域における知識不足:汎用型モデルはドメイン知識が不足しており、ハルシネーションが発生しやすい。
これらの課題に対し、自社LLMの開発に取り組む企業が増えています。自社データを学習させることで、業界専門用語への対応や自社独自の知識・ノウハウをLLMに統合することが可能です。
パナソニックHDのマルチモーダル基盤モデル
「Panasonic-LLM-100b」は、パナソニックHDが開発中のマルチモーダル基盤モデルに統合され、AI開発・社会実装を加速します。
ストックマークの技術とパナソニックHDのデータ・ドメイン知識のシナジーにより、「Scalable AI」及び「Responsible AI」の実現を目指します。
まとめ
パナソニックHDとストックマークが協業し、国内最大規模のLLMを開発
1,000億パラメータ規模のLLM「Panasonic-LLM-100b」
ビジネス領域に特化し、ハルシネーションを抑制
自社LLM開発でコストや知識不足の課題を解決
マルチモーダル基盤モデルに統合し、AI活用を加速
ハッシュタグ
#AI #テクノロジー #パナソニック #ストックマーク #LLM #生成AI #ビジネス #ドメイン知識 #自社LLM
参考文献
おすすめ記事
よろしければサポートもよろしくお願いいたします.頂いたサポートは主に今後の書評執筆用のために使わせていただきます!