見出し画像

【論文紹介】バイオコードによるシングルセルデータの分離 | Nature Biotechnology

公開日 :2024年1月15日
研究機関:ヘブライ大学
主体ラボ:Mor Nitzan

抄録

Biolord is a deep generative method for disentangling single-cell multi-omic data to known and unknown attributes, including spatial, temporal and disease states, used to reveal the decoupled biological signatures over diverse single-cell modalities and biological systems. By virtually shifting cells across states, biolord generates experimentally inaccessible samples, outperforming state-of-the-art methods in predictions of cellular response to unseen drugs and genetic perturbations. Biolord is available at https://github.com/nitzanlab/biolord.

Biolordは、単一細胞のマルチオームデータを、空間的、時間的、疾患状態を含む既知および未知の属性に分離するための深い生成的手法であり、多様な単一細胞モダリティと生物学的システムにわたる分離された生物学的シグネチャーを明らかにするために使用される。Biolordは、細胞の状態を仮想的にシフトさせることで、実験的にアクセス不可能なサンプルを生成し、未知の薬剤や遺伝的摂動に対する細胞応答の予測において、最先端の手法を凌駕する。Biolordはhttps://github.com/nitzanlab/biolord。

Paper Interpreterの出力

【アブストラクト】
Biolordは、空間的・時間的・疾患状態などの既知および未知の属性を含む単一細胞多オミクスデータを解離するための深層生成手法です。この手法は、細胞を仮想的に異なる状態にシフトさせることで、実験的にアクセスできないサンプルを生成し、従来の手法よりも優れた細胞応答の予測を可能にします【7†source】。

【背景】
細胞の遺伝子発現プロファイルは、細胞タイプ、組織の起源、分化段階など、多くの属性に関する情報を同時に符号化します。単一細胞技術は、これらの発現プロファイルに関する情報を提供しますが、測定された遺伝子発現を解読し、それらのプロセスを互いに解離することは依然として大きな課題です【8†source】。

【方法】
Biolordは、機械学習の解離手法を利用し、未知の前方プロセスによって生成された観測データにマッピングされた生成要因(属性)を逆にマッピングします。例えば、画像の車がモデルや姿勢などの複数の属性によって生成されるように、生物学的環境では、ラベル付けされた単一細胞データ(例えば、細胞タイプや年齢の注釈)を用いて、既知の属性から未知の属性を解離します【9†source】。

【結果】
Biolordは、未確認の薬剤や遺伝的摂動への細胞応答の正確な予測に成功しています。このモデルは、約650,000の単一細胞トランスクリプトームを含むsci-Plex 3データセットを使用し、188種類の化合物にさらされた3種類のがん細胞株のデータを分析しました【11†source】。

【議論】
Biolordは、様々な単一細胞モダリティと生物学的システムに対して適用され、これらの解離された表現が提供する洞察の範囲を示しています。また、既知の属性に関しては解離された表現に焦点を当てていますが、未知の属性の表現についてはさらなる研究が必要です。また、属性が相関している場合、

の望ましい結果は不明です。しかし、このような制限を軽減するために、Biolordは各生物学的属性の基礎構造を独立して抽出することができます。最後に、Biolordは深層生成フレームワークであるため、直接的な解釈可能性に欠けますが、この問題は、分離された潜在埋め込みと生成モデルを使用した様々な下流分析ツールを提案することで克服されています。Biolordは単一細胞データにエンコードされた細胞アイデンティティを解離するための一歩を提供し、観測された発現に対する異なる成分の影響を解明し、多オミクスデータの新たな洞察とより良い利用を提供します【14†source】。

【制限事項】
Biolordの制限事項として、既知の属性に関して解離された表現に焦点を当てたため、未知の属性の表現に関する研究は不足しています。また、属性が相関している場合の望ましい結果は不明です。さらに、深層生成フレームワークであるため、直接的な解釈可能性に欠けますが、分離された潜在埋め込みと生成モデルを使用した様々な下流分析ツールによってこの問題は部分的に克服されています【14†source】。

【可能な応用】
Biolordは、単一細胞データにおける未知の薬剤や遺伝的摂動への細胞応答の正確な予測、感染症遺伝子プログラムの露呈、感染状態に向けた遷移軌道の露呈など、さまざまな生物学的設定に適用可能です。これにより、感染関連属性の特定、個々の細胞レベルでの感染関連変化の評価、未注釈細胞の分類など、多様な下流分析タスクを可能にします【11†source】【12†source】【13†source】。


この記事が気に入ったらサポートをしてみませんか?