ファイナンス機械学習:特徴量の重要度 証券並列計算と特徴量Stucking

証券並列重要度計算法では、投資ユニバースに含まれる各証券($${i=1,\dots I}$$に、データセット$${{\bf X}_i,{\bf y}_i}$$を作成し、この証券における特徴量($${j=1,\dots J}$$)の重要度を基準$${k}$$で導出し、$${\lambda_{i,j,k}}$$とする。
 これを投資ユニバース全集合で集約し、このユニバースでの特徴量$${j}$$の基準$${k}$$の結合重要度$${\Lambda_{j,k}}$$が得られる。
 このアプローチの利点は、各証券での重要度解析を並列で行えることであるが、代替効果で重要度の分散は大きくなるため、十分大きな投資ユニバースであることが求められる。
 
特徴量のStuckingは、投資ユニバースに含まれる証券$${i}$$特徴量$${X_i}$$の移動ウィンドウ標準化などで変換し、分布の分散をある程度均一にした$${\tilde{X}_i,i=1,\dots,I}$$をスタックし、単一のデータセット$${{\bf X,y}}$$として、重要度を推定することである。
 投資対象全体が、分類器によって単一の証券であるかのように扱われ、分類器は全ての証券でどの特徴量の重要度が高いかを、同時に学習する。これにより、上記の並列計算で必要であった統合時の重み付けは必要なくなり、また小さなデータセットで起こりやすくなる過学習も避けられる。

この二つの方法とも、計算機負荷が大きく、並列化が必須で、大型計算機システムが要求される。

この記事が気に入ったらサポートをしてみませんか?