Scalable Randomized Kernel Methods for Multiview Data Integration and Prediction

我々は、複数のソースからのデータを共同で関連付け、同時に転帰を予測したり、ユニットを2つ以上のクラスのいずれかに分類するためのスケーラブルなランダムカーネル法を開発する。提案する手法は、臨床転帰の予測とともにマルチビューデータの非線形関係をモデル化し、ビュー間の関係に最も貢献する変数または変数群を特定することができる。ランダムフーリエベースがシフト変量カーネル関数を近似できるというアイデアを用いて、各ビューの非線形マッピングを構築し、これらのマッピングと転帰変数を用いて、ビューに依存しない低次元表現を学習する。シミュレーションにより、提案手法はマルチビューデータ統合のための他のいくつかの線形および非線形手法を凌駕することが示された。提案手法をCOVID-19に関連する遺伝子発現、メタボロミクス、プロテオミクス、リピドミクスデータに適用したところ、COVID-19の状態や重症度を示すいくつかの分子シグネチャーが同定されました。実データへの適用とサンプルサイズが小さい場合のシミュレーションの結果から、提案手法はサンプルサイズが小さい問題に対して有効であることが示唆された。利用可能性 我々のアルゴリズムはPytorchで実装され、Rでインターフェースされており、このhttpsのURLで公開される予定です。

この記事が気に入ったらサポートをしてみませんか?