見出し画像

研究とベンチャーと数学と(その3)

大学新入生に伝えたいのは,講義が面白くなくても線形代数は重要であるということだ.前回,製造業で異常検出に使われている多変量統計的プロセス管理(MSPC)を転用して,てんかん発作を事前に予知できることを示した.今回は,これらの研究にとって線形代数がどれほど大切かを見ていこう.

その前に,前回までの記事を読んでいない人は,「研究とベンチャーと数学と(その1)」「研究とベンチャーと数学と(その2)」をどうぞ.

多変量統計的プロセス管理(MSPC)

前回説明したとおり,(古典的な)多変量統計的プロセス管理(MSPC)は,主成分分析(PCA)を利用して変数間の関係をモデル化することで,異常検出性能を高めている.より具体的には,PCAによる次元圧縮を実施した上で,主成分で張られる部分空間をT2統計量によって,その直交補空間をQ統計量によって管理する.このようにして,MSPCは,監視したい変数の数にかかわらず,変数間の関係を考慮して2つの統計量を算出し,それらに管理限界を設定することで,異常検出を行う.

画像1

次元・部分空間・直交・直交補空間

ひとまず主成分分析(PCA)は脇におくとしても,「次元」「部分空間」「直交」「直交補空間」といった言葉が理解できなければ,MSPCが何をしているかは謎のままだろう.どれも線形代数の教科書のはじめに登場する基本的な用語だ.

線形代数がわからなければ,MSPCを使いこなすことができないばかりか,それが何であるかさえ理解できない.

わかったような気になる

多変量統計的プロセス管理(MSPC)を教えてほしいという要望は多い.色々なところで解説したりもする.そういうときには,上図のようなスライドを見てもらいつつ,MSPCのイメージを伝えて,まずは,わかったような気になってもらう.

わかったような気になれれば,誰かがMSPCを使っているのを見ても,拒絶反応を示さなくてすむ.これは使用者にとって朗報だ.訳も分からず反対する人に邪魔されにくくなるのだから.

ただ,わかったような気になったくらいでは,適切に使うことはできない.大切なのは「適切に」という点だ.いくらでもツールはあるのだから,誰でも使うくらいはできる.ボタンを押せば何か計算をして結果を出してくれる.適切に,適材適所で使うことができないのだ.これはMSPCに限らず,どのような方法についても言える.

主成分分析(PCA)

主成分分析(PCA)の話もしよう.PCA は,変数間の相関を考慮してモデルを構築するために,変数の線形結合で与えられる主成分の分散が最大となるように,かつ主成分同士が無相関となるように,主成分を決定する.変数が100個あるなら,最大100個の主成分を導出することができる.ただ,多くの場合,分散が大きな主成分だけを採用して,その他は捨てる.このようにして次元削減を行うことができる.

主成分を求めるためには,データ行列を特異値分解すればいい.あるいは,共分散行列を固有値分解すればいい.実に簡単だ.そう,線形代数を知っていればね.

行列・特異値分解・固有値分解

線形代数以前の話かもしれないが,「行列」を知らないとどうしようもない.数字も知らないのに,足し算や掛け算はできない.それと同じで,行列を知らなければ,多次元空間で何もできない.だから,高校の教科書から「行列」が消えるといった話になると大学関係者らがざわつくわけだ.

「特異値分解」「固有値分解」も線形代数に登場する方法だ.特に固有値分解は,主成分分析を含む多変量解析でいつも使われる道具であるため,データ解析を行うなら,どうしても理解しておく必要がある.

講義が面白くなくても線形代数は重要

というわけで,大学新入生には是非とも「線形代数」を修得して欲しい.わかったような気になるだけでなく,使いこなせるほどに.データ解析も含めて,線形代数を知っていれば,できることが圧倒的に増える.やりたいことができる可能性が高くなる.最高だ.

© 2020 Manabu KANO.

この記事が気に入ったらサポートをしてみませんか?