パナソニックHDとストックマーク、国内最大規模の日本語LLM「Panasonic-LLM-100b」開発で協業

2024年7月3日 09:07

発表日：2024年7月2日

概要

パナソニックホールディングス株式会社（以下、パナソニックHD）とストックマーク株式会社（以下、ストックマーク）は、パナソニックグループ専用の大規模言語モデル（LLM）「Panasonic-LLM-100b」の開発で協業することを発表しました。

この協業により、ストックマークが独自に開発したLLM「Stockmark-LLM-100b」に、パナソニックグループの社内データを追加学習させた「Panasonic-LLM-100b」を構築します。このLLMのモデルサイズは1,000億パラメータを予定しており、国内最大規模の企業専用LLMとなる見込みです。

取り組みの概要

今回の取り組みでは、ビジネス領域における国内最大規模の知識を学習させた「Stockmark-LLM-100b」に、パナソニックグループの社内情報を追加学習させて、専用の日本語LLM「Panasonic-LLM-100b」を構築します。

一般的な企業のLLMは70～130億パラメータの小型モデルが多い中、今回の1,000億パラメータ規模のLLMは、膨大な社内データを活用し、パナソニックHDのマルチモーダル基盤モデルへの統合を目指します。また、セキュリティ面にも配慮し、秘匿データを安全に学習する仕組みを構築予定です。

生成AIとLLMとは？

生成AI（Generative AI）は、与えられたデータをもとに新しいコンテンツを生成する人工知能技術です。これに対して、大規模言語モデル（LLM：Large Language Model）は、膨大なデータを学習し、自然言語を理解・生成するAIの一種です。最近では、企業専用のLLMを開発することで、業務効率の向上や新たな価値創出が期待されています。

「Stockmark-LLM-100b」について

「Stockmark-LLM-100b」は、経済産業省とNEDOが主催するプロジェクト「GENIAC」に採択され、2024年5月に商用利用可能な形式で公開されたLLMです。

このモデルは、1,000億パラメータ規模で、日本語・ビジネス領域に特化しており、ハルシネーションの抑制を実現しています。今回は、パナソニックHD向けに追加学習を行い、より精緻化されたモデルを提供します。

取り組みの背景

生成AIは、業務オペレーションや価値創出のあり方を根底から変えつつありますが、汎用型モデルには以下のような課題があります：

利用コストの肥大化：利用量に応じて課金され、コストが増大することから、あらゆる業務に組み込むのは困難。
ビジネス領域における知識不足：汎用型モデルはドメイン知識が不足しており、ハルシネーションが発生しやすい。

これらの課題に対し、自社LLMの開発に取り組む企業が増えています。自社データを学習させることで、業界専門用語への対応や自社独自の知識・ノウハウをLLMに統合することが可能です。

パナソニックHDのマルチモーダル基盤モデル

「Panasonic-LLM-100b」は、パナソニックHDが開発中のマルチモーダル基盤モデルに統合され、AI開発・社会実装を加速します。

ストックマークの技術とパナソニックHDのデータ・ドメイン知識のシナジーにより、「Scalable AI」及び「Responsible AI」の実現を目指します。

まとめ

パナソニックHDとストックマークが協業し、国内最大規模のLLMを開発
1,000億パラメータ規模のLLM「Panasonic-LLM-100b」
ビジネス領域に特化し、ハルシネーションを抑制
自社LLM開発でコストや知識不足の課題を解決
マルチモーダル基盤モデルに統合し、AI活用を加速

ハッシュタグ
#AI #テクノロジー #パナソニック #ストックマーク #LLM #生成AI #ビジネス #ドメイン知識 #自社LLM