アセットマネージャーのためのファイナンス機械学習:特徴量の重要度分析 クラスターMDI、クラスターMDA

前記事で作成したデータセットの特徴量をクラスタにまとめてから、MDIとMDAを適用する。

import ONC as onc
corr0,clstrs,silh=onc.clusterKMeansBase(X.corr(),maxNumClusters=10,n_init=10)
sns.heatmap(corr0,cmap='viridis')

ここでは、特徴量の相関行列で、ONCではなく、KMean法を使ったクラスタリングを使用した。
 クラスタリングの結果は以下のようになった。

KMeansBase Clustering
クラスタリングの結果

雑音がクラスタ2にまとめられている。
このクラスタにクラスタMDIを適用した。

Clustered_MDI

同様にクラスタMDAを適用した。

クラスタ3がMDIとMDAの両方で最も重要と判断されている。ノイズの入ったクラスタ2が共に重要度が低いとも判断されている。

この記事が気に入ったらサポートをしてみませんか?