見出し画像

技術士(経営工学・情報工学)が教えるDX(デジタルトランスフォーメーション)講座36デジタライゼーション(③SoI)の実践-クロス集計でつくる多変量解析のデータ下準備-

 昔、データ分析の講習会で講師をさせていただいたとき、参加者に分析してみたいデータを持ってきて欲しいと頼んだら、当日見せてもらったデータがことごとく集計済みのデータで、それ以上分析しようがなかったという経験をしたことがあります。
 
 私が期待していたのは、営業ならば日々の販売データや営業日報、工場ならば製造データや品質記録といった日々の収集データを期待していたのですが、結局、参加者が望んでいたのは、こういう集計表があるけれども、ここから何を読み取ればよいか教えて欲しいということだったのだと思います。
 
 そもそもデータ分析を行う上で、明確にしておかないといけないのは目的です。「なぜデータ分析するのか?」、「何を知りたいのか?」という目的感なしにデータを集計してみても、運良く何かが見つかるのではと考えるのは少し甘いような気がします。
 
 AI活用にしても、将棋の勝ち負けや品質の良不良など、結果としての知りたいデータがまずあって、その原因を探るための材料データを用意して、その因果関係を探るという形になっています。
 
DX推進におけるSoI(System of Insight;分析のためのシステム」はデータから得られた知見によって、ビジネスイノベーションを起こそうとするものです。昔からやっているデータ分析の延長では、目新しい発見を期待することは難しいでしょう。
 
 SoIでめざすべきデータ分析はトレンドの後追いではなく先読みです。この先に予測されるビジネス環境の変化を予測することによって、その変化に適合するビジネスモデルの構築をめざすことがDXにつながるのです。決してただ単にデータ分析やAI活用すればDXになるというわけではありません。
 
 前回ご紹介した散布図による相関分析もトレンドの先読みをしようという試みでした。
今回取り上げるのはAIなど様々なデータ分析の基礎となる多変量解析についてご説明したいと思います。
 
 多変量解析とは、先に挙げたように、データ分析の目的を従属変数(目的変数)として置き、その原因として考えられる項目を独立変数(説明変数)として置いて、何らかのトレンドを見つけようとするものです。

「多変量解析とは?意味・使い方・解釈の概要」より引用 https://haru-reha.com/maltivariate-analysis-summary/

 実はAIの代表格であるディープラーニングもこの多変量解析の延長に存在するのであり、人が行う多変量解析のパラメータは多くても数十個程度なのに対して、ディープラーニングの場合は1万、1億、さらに巨大なモデルでは2千億にものぼると言われています。
 
さて、冒頭で私の講習会での体験をお話ししましたが、昔も今も効果的なデータ分析のためには、データ分析作業そのもの以上に、データ分析用のデータを準備することが非常に大切になります。専門的に言い換えれば、データ分析のための基盤-DMP(データマネジメントプラットフォーム) -づくりが重要になるということです。
 
SAP社のS/4HANAもデータ活用基盤の構築を強くアピールしており、いかにDX推進においてデータ分析を重要視しているかがわかります。
 
 さて、このデータ分析のための基盤-DMP(データマネジメントプラットフォーム)ですが、今回もExcelだけを使った事例でその概念について解説してみたいと思います。
 
 わかりやすくするために、今、日付順に並んだ商品分類別の売上データがあるとしましょう。このままでもピポットテーブルなどの機能を使えば年月と商品分類などとのクロス集計をつくることができるのですが、それだけでは新たな知見を得るのは難しいでしょう。

 そこで、いきなり成果物としての集計表をつくるのではなく、ここではピポットテーブルを使って、多変量解析を行うための下準備としてのクロス集計を行います。その結果、売上合計を従属変数(目的変数)に、商品分類別の売上を独立変数(説明変数)とする多変量解析のためのデータ分析基盤をつくることができるのです。

 ここまでくれば、Excelだけでも「データ分析」(オプションから無料アドイン追加できます。)から回帰分析などの多変量解析を実行することもでき、前回同様、散布図で相関分析することも簡単にできます。

 さらに、SPSSなどの統計解析ツールやPythonのscikit-learnライブラリなどを使えば、購買傾向が似ている顧客を識別するためのクラスター分析も行うことができます。
 
 2023年9月26日からWindows 11の無償アップデートとして提供されているMicrosoft 365 Copilotを使えば、こうした専門的なデータ加工もAIサポートによって、簡単にできるようになっています。
 
従来どおりのデータ分析にもとづく業績評価や将来予測も不要とは思いませんが、新たなビジネスチャンスの発見をめざして、DMP(データマネジメントプラットフォーム)の構築をめざしてみてはいかがでしょうか。

この記事が気に入ったらサポートをしてみませんか?