見出し画像

arXiv search: September 06, 2024

Exploring brain transcriptomic patterns: a topological analysis using spatial expression networks
目的:
この研究の主な目的は、人間の脳のトランスクリプトームのアーキテクチャを特徴づけることにより、脳の機能と疾患に関する理解を深めることです。具体的には、異なる解剖学的脳領域間での空間的共発現パターンを明示的に捉える新しい遺伝子の転写活動の表現を提案し、そのトポロジカルな類似性を用いて自然に発生するクラスターを特定し、トポロジカルの多様性が生物学的機能の違いを反映しているかどうかを評価することです。
使用されたデータや情報:
この研究では、Allen Human Brain Atlas (AHBA) プロジェクトによって生成された実験データを使用しています。このデータセットには、成人人間の脳のすべての主要な解剖学的構造をカバーする広範な解剖学的範囲から得られた脳遺伝子発現のパターンが含まれています。具体的には、16,906個の遺伝子について、左半球の105の脳領域にわたる正規化された発現レベルを使用して、各遺伝子の空間表現ネットワーク(SEN)を構築しました。
新規性や解決した問題:
この研究の新規性は、遺伝子の転写活動を空間表現ネットワーク(SEN)としてモデル化し、それによって脳内の異なる解剖学的領域間での表現レベルの類似性を量化する新しい方法を提案したことにあります。このアプローチにより、遺伝子の生物学的類似性を反映する可能性のあるトポロジカルな類似性を基にクラスタリングを行い、3つの大きな安定したクラスタを特定しました。これらのクラスタは、神経系、免疫系、転写・翻訳に関連する遺伝子群をそれぞれ含んでおり、トポロジカルな特徴と生物学的機能の違いを示しています。
未解決の問題:
今後の課題としては、異なる脳領域や細胞タイプに特異的な遺伝子発現のパターンをさらに詳細に解析することが挙げられます。また、SENクラスタの生物学的機能の違いをさらに詳細に理解するために、追加の遺伝子オントロジーや細胞タイプ特異的なデータセットを用いた解析が必要です。さらに、SENの表現パターンが脳の疾患や障害とどのように関連しているかを明らかにするための研究も重要です。
url:
https://arxiv.org/abs/1610.02548
title:
Exploring brain transcriptomic patterns: a topological analysis using spatial expression networks
authors:
Zhana Kuncheva, Michelle L. Krishnan, Giovanni Montana
date:
8 October, 2016;

Deep Learning in Spatially Resolved Transcriptomics: A Comprehensive Technical View
目的:
与えられた論文は、空間的に解決された単一細胞トランスクリプトーム(SRT)データから、細胞のタイプや状態、その他のトランスクリプショナルパターンを解明することを目的としています。具体的には、遺伝子の空間的変動を特定し、組織セクション全体の表現パターンを理解することを目指しています。
使用したデータや情報:
この論文では、SRTデータのスポットをグラフの頂点と見なし、各ノードに複数の属性(遺伝子発現マトリックスや形態学的特徴など)を含むモデルを使用しています。また、形態学的特徴は、ImageNetデータセットで事前に訓練されたマスクされたオートエンコーダー(MAE)モデルを用いて抽出されています。
新規性や解決できた問題:
conSTモデルは、遺伝子発現、空間情報、形態情報を統合して低次元の埋め込みを学習することで、クラスタリングやその他の下流タスクに利用できるフレームワークを提供します。特に、コントラスト学習を用いてロバストな埋め込みを学習する点が新規であり、局所的な情報だけでなく、グローバルな構造やコンテキストレベルの要約との相互情報を最大化することで、より詳細なデータの理解を可能にしました。
未解決問題:
conSTは非組織学的データセットを事前訓練モデルに使用しており、高いパラメータチューニングが必要であるため、メソッドの機能に影響を与える可能性があります。また、形態学的特徴がトレーニングプロセスに含まれていない場合(例えば、SEDRのようなモデル)や、DLモデルが解釈可能性を欠いている場合の対応も今後の課題です。
url:
https://arxiv.org/abs/2210.04453
title:
Deep Learning in Spatially Resolved Transcriptomics: A Comprehensive Technical View
authors:
Roxana Zahedi Nasab, Mohammad Reza Eftekhariyan Ghamsari, Ahmadreza Argha, Callum Macphillamy, Amin Beheshti, Roohallah Alizadehsani, Nigel H. Lovell, Mohammad Lotfollahi, Hamid Alinejad-Rokny
date:
8 May, 2023;

Statistical Power Analysis for Designing Bulk, Single-Cell, and Spatial Transcriptomics Experiments: Review, Tutorial, and Perspectives
目的:
与えられた論文では、異なるタイプのデータ(人体および動物の組織)が真のクラスターを回復するために必要とされる視野(FoVs)の数とサイズが異なること、そしてHSTデータ生成技術が細胞クラスターの識別とFoVsの数とサイズの関係にどのように影響するかを調査しています。
使用されたデータや情報:
この研究では、実際の心疾患および乳がんのデータにこの実験を適用しました。また、シミュレーションされたHSTアプローチを用いてHST実験の設計を調査し、様々なタイプのHSTデータを生成しました。
新規性や解決できた問題:
この研究は、視野の数とサイズが統計的なパワーに影響を与えることを発見しました。特に、組織構造の性質が真の細胞タイプを発見するために必要な細胞とFoVsの数に影響を与えること、および細胞間コミュニケーションタスクにおいて、不十分なFoVサイズでは細胞間の相互作用が捉えられない可能性があることを指摘しました。
未解決問題:
この研究は、点参照データ(点プロセスデータ)に直接適用することが困難であり、シミュレーションデータ生成モデル(「in silico」アプローチ)は、クラスターラベルのための強い事前知識を必要とする空白の組織スキャフォールドに基づいています。これは点参照データの変動をすべて捉えることができません。また、FoVsの数とサイズに焦点を当てている間に他の実験的な要因を無視しているという制限もあります。
url:
https://arxiv.org/abs/2301.02918
title:
Statistical Power Analysis for Designing Bulk, Single-Cell, and Spatial Transcriptomics Experiments: Review, Tutorial, and Perspectives
authors:
Hyeongseon Jeon, Juan Xie, Yeseul Jeon, Kyeong Joo Jung, Arkobrato Gupta, Won Chang, Dongjun Chung
date:
7 January, 2023;

A joint model of unpaired data from scRNA-seq and spatial transcriptomics for imputing missing gene expression measurements
目的:
この研究の主な目的は、scRNA-seqデータと空間トランスクリプトミクスデータを統合し、空間データセットで欠落している遺伝子の発現を予測することです。具体的には、異なる実験プロトコルから得られたデータを統合し、共通の潜在空間に埋め込むことにより、遺伝子発現の完全なマップを再構築することを目指しています。
使用データ:
この研究では、マウスの体性感覚皮質からの3,005個の細胞を含むscRNA-seqデータセットと、同じ組織からの4,462個の細胞と33個の遺伝子を含むosmFISHデータセット、およびマウス前頭前皮質からの71,639個の細胞を含むscRNA-seqデータセットと、同じ組織からの3,704個の細胞と166個の遺伝子を含むstarMAPデータセットを用いています。
新規性と解決問題:
この研究の新規性は、scRNA-seqデータと空間トランスクリプトミクスデータを組み合わせることにより、欠落データの予測を可能にする統合モデル「gimVI」を開発したことにあります。このモデルは、異なるデータソースからのバイアスを考慮しながら、データを共通の潜在空間に統合することができます。また、このモデルは、遺伝子の欠落を予測するだけでなく、細胞タイプの注釈付けや物理的位置の近似も可能にします。
未解決問題:
今後の課題としては、より広い範囲のG'/Gの比率に対するモデルのロバスト性を調査すること、また、異なる実験プロトコルによるデータのバイアスをさらに正確にモデル化する方法の開発が挙げられます。これにより、モデルの精度と適用性をさらに向上させることが期待されます。
url:
https://arxiv.org/abs/1905.02269
title:
A joint model of unpaired data from scRNA-seq and spatial transcriptomics for imputing missing gene expression measurements
authors:
Romain Lopez, Achille Nazaret, Maxime Langevin, Jules Samaran, Jeffrey Regier, Michael I. Jordan, Nir Yosef
date:
6 May, 2019;

Bayesian Modeling of Spatial Molecular Profiling Data via Gaussian Process
目的:
与えられた論文の主な目的は、細胞の空間的な組織とそれらのmRNAおよびタンパク質の豊富さを調査することにより、異なる起源の細胞がどのようにして独特な構造と機能を持つ組織を形成するかを明らかにすることです。これにより、従来の分子プロファイリング技術やイメージング技術の限界を超え、組織の形態学的/空間的情報と高スループットな分子プロファイルを統合する新しい技術が必要とされています。
使用したデータや情報:
論文では、seqFISH、MERFISH、空間トランスクリプトミクス、Slide-seqなどの画像ベースおよびシーケンスベースの方法を含む空間分子プロファイリング(SMP)技術を用いています。これらの技術を使用して、組織スライド上の数千の細胞の遺伝子発現やタンパク質の豊富さを同時にマッピングし、測定することができます。
新規性および解決できた問題:
この論文の新規性は、組織の空間情報と高スループットな分子プロファイルを統合することにより、単一細胞の包括的な分子特性評価を可能にした点にあります。また、空間的に相関するパターンを示す遺伝子(空間的に変動する遺伝子)を特定することで、組織の異質性や基盤となる組織構造が異なる空間的位置での異なる発現を駆動する可能性があることを示唆しています。
未解決問題:
将来的には、これらの空間的に変動する遺伝子がどのようにして組織の発達や病理に関与しているかをさらに詳細に解析すること、また、より多くの組織タイプや疾患状態での応用を拡大することが挑戦として残されています。さらに、データの解析や解釈を改善するための統計的手法や計算ツールの開発も重要な課題です。
url:
https://arxiv.org/abs/2012.03326
title:
Bayesian Modeling of Spatial Molecular Profiling Data via Gaussian Process
authors:
Qiwei Li, Minzhe Zhang, Yang Xie, Guanghua Xiao
date:
6 December, 2020;

A Bayesian Modified Ising Model for Identifying Spatially Variable Genes from Spatial Transcriptomics Data
目的:
この論文では、空間的トランスクリプトームデータから空間的に変動する(SV)遺伝子を特定する多段階の方法を開発することを目的としています。既存の方法が特定のカーネルを用いてSV遺伝子を特徴づけるのに対し、この研究ではSV遺伝子をより柔軟に特定する新しいアプローチを提案しています。
使用されたデータや情報:
この研究では、ヒトの乳がん研究およびマウスの嗅覚球から構築された実際のパターンを含む、様々な空間パターンを用いたシミュレーションデータを使用しています。また、BOOST-MIという新しいモデルを用いて、これらのデータからSV遺伝子を特定しています。
新規性と解決できた問題:
この研究の新規性は、BOOST-MIモデルを用いることで、従来の方法では検出できなかった引力パターンのSV遺伝子を特定できる点にあります。また、GOエンリッチメント分析を通じて、これらのSV遺伝子がどのように機能的に関連しているかを明らかにし、特にウイルス関連のGO用語が乳がんとの因果関係を持つ可能性があることを示唆しています。
未解決問題:
BOOST-MIモデルは多くのSV遺伝子を特定することができましたが、特定のパターンにおいてはSV遺伝子の数が非常に少ないことがあり、その原因や解決策についてのさらなる研究が必要です。また、他の疾患や異なる組織におけるSV遺伝子の特定にこのモデルがどのように適用できるか、その有効性を検証する必要があります。
url:
https://arxiv.org/abs/2104.13957
title:
A Bayesian Modified Ising Model for Identifying Spatially Variable Genes from Spatial Transcriptomics Data
authors:
Xi Jiang, Qiwei Li, Guanghua Xiao
date:
5 October, 2021;

Analysis and visualization of spatial transcriptomic data
目的:
与えられた論文では、空間トランスクリプトミクスにおけるデータ解析と可視化に関する様々な手法やアプローチを紹介し、それを通じて病気の細胞を予測するための統合的な手法を提案しています。具体的には、組織の形態と空間的な遺伝子発現を統合して病気の細胞を特定することを目指しています。
使用したデータや情報:
この論文では、マイクロアレイベースの空間トランスクリプトミクスデータ、シングルセルRNAシーケンシングデータ、ヒト扁平上皮癌の組成と空間アーキテクチャの多モーダル分析、マウス海馬の空間的な組織配置を明らかにするシングルセルの転写プロファイリングなど、多様なデータセットが用いられています。
新規性や解決できた問題:
与えられた論文の新規性は、異なるタイプのデータソースを統合することにより、組織のアーキテクチャや病気の細胞の特定に新たな洞察をもたらすことです。例えば、空間的な遺伝子発現データと組織の形態を統合することで、病気の細胞をより正確に予測することが可能になります。また、空間的ドメインの同定に関する方法の開発は、重要な解剖学的領域を特定する新たな手段を提供します。
未解決問題:
将来取り組むべき未解決問題としては、より大規模なデータセットに対して計算効率良く適用可能な手法の開発、さらに精密な空間的パターンの検出、異なる疾患や組織タイプにおける手法の適用性の拡張などが挙げられます。また、空間トランスクリプトミクスデータの直接的な可視化の進展も重要な課題です。
url:
https://arxiv.org/abs/2110.07787
title:
Analysis and visualization of spatial transcriptomic data
authors:
Boxiang Liu, Yanjun Li, Liang Zhang
date:
5 February, 2022;

Brain perfusion mediates the relationship between miRNA levels and postural control
目的:
この研究の主な目的は、接触スポーツに従事するアスリートにおいて、miRNAレベルの変化が脳の血流変化(rCBF)にどのように関連しているかを調査し、特にバーチャルリアリティ(VR)バランススコアとの関連を評価することです。これにより、反復的な頭部外傷(HAE)によって引き起こされる異常な神経炎症過程を理解し、治療や回復の戦略を提案することを目指しています。
使用されたデータや情報:
この研究では、24人の大学アメリカンフットボール選手から収集されたデータが使用されました。具体的には、プレシーズンのMRIスキャン、血液サンプルからのmiRNAの測定、およびVRニューロコグニティブテストによるバランススコアが含まれています。これらのデータを統合して、miRNAのレベル、脳の血流、およびVRバランススコアとの関連を分析しました。
新規性や解決できた問題:
この研究は、miRNAと脳の血流の変化および運動制御能力との間の直接的な関連を示しました。特に、miRNAのレベルが高いアスリートは、プタメンの血流が低下し、VRバランススコアが低い傾向にあることが明らかになりました。これにより、miRNAが神経炎症と運動制御の障害と関連している可能性が示唆され、これは接触スポーツによる長期的な影響を理解する上で重要です。
未解決問題:
この研究では、男性アスリートのみが対象であり、性別の違いが結果にどのように影響するかは不明です。また、標本数が比較的少ないため、より大きなコホートでの研究が必要です。さらに、miRNAと他の認知機能や行動出力との関連についても、今後の研究で詳細に調査する必要があります。これらの問題を解決することで、より効果的な治療法や予防策が開発される可能性があります。
url:
https://arxiv.org/abs/1912.02901
title:
Brain perfusion mediates the relationship between miRNA levels and postural control
authors:
Yufen Chen, Amy A Herrold, Zoran Martinovich, Anne J Blood, Nicole Vike, Alexa E Walter, Jaroslaw Harezlak, Peter H Seidenberg, Manish Bhomia, Barbara Knollmann-Ritschel, James L Reilly, Eric A Nauman, Thomas M Talavage, Linda Papa, Semyon Slobounov, Hans C Breiter
date:
5 December, 2019;

Unbalanced Low-rank Optimal Transport Solvers
目的:
与えられた論文の主な目的は、最適輸送(OT)手法を自然科学の分析パイプラインに適用することの実用性を示すことです。また、質量保存の厳格な仮定から逸脱する自由度が実際には必要であること、そして低ランクアプローチが自然科学の適切なサンプルサイズにOT方法をスケーリングする可能性を持っていることを示すことを目指しています。
使用されたデータや情報:
論文では具体的なデータセットの名前は挙げられていませんが、自然科学の分野で得られたデータを用いて、最適輸送手法の適用可能性と効果を評価しています。特に、脳の解剖学的構造と機能信号を統合するためのデータが使用されていることが示唆されています。
新規性や解決できた問題:
この論文での新規性は、質量保存の制約を緩和した非バランス型の最適輸送問題へのアプローチと、計算効率を向上させるための低ランクアプローチの組み合わせにあります。これにより、大規模なデータセットに対しても、効率的かつ効果的に最適輸送手法を適用することが可能になります。
未解決問題:
未解決の問題としては、さらに複雑なデータ構造や異種データ間での最適輸送問題の解法の開発が挙げられます。また、より多様な自然科学のシナリオへの適用例を増やし、その効果を検証することも重要です。さらに、最適輸送手法の理論的な側面、特に非バランス型の問題における数学的な特性や解の安定性に関する研究も必要です。
url:
https://arxiv.org/abs/2305.19727
title:
Unbalanced Low-rank Optimal Transport Solvers
authors:
Meyer Scetbon, Michal Klein, Giovanni Palla, Marco Cuturi
date:
31 May, 2023;

The Dyson Equalizer: Adaptive Noise Stabilization for Low-Rank Signal Detection and Recovery
目的:
与えられた論文の主な目的は、データ行列からノイズの構造を推定し、その情報を用いて信号成分を推定することです。特に、データ行列の特異値分解(SVD)を利用して、ノイズの分散構造を推定し、その推定結果を用いて信号ベクトルxとyを推定する手法を提案しています。
使用データ・情報:
この研究では、シンメトリックなデータ行列Yを使用しています。Yは、元のデータ行列の上半分に元のデータ行列Y、下半分にその転置行列Y^Tを配置したブロック行列です。この行列からレゾルベントR(z)を計算し、その主対角成分の虚部からノイズの分散構造を推定するg(η)を計算します。
新規性および解決した問題:
この研究の新規性は、特異値分解を用いてデータ行列のノイズ成分のみを分離し、その情報から信号成分を推定する方法にあります。従来の方法と比較して、強い低ランクの信号が存在してもその影響を受けにくいという利点があります。この手法により、ノイズの分散が信号成分に与える影響を正確に把握し、より正確な信号の推定が可能になります。
未解決の問題:
未解決の問題としては、異なるタイプのノイズやより複雑なデータ構造に対する方法の適用性が挙げられます。また、実際のデータに適用した際の性能の検証や、計算効率の向上も重要な課題です。さらに、ノイズの統計的性質をより詳細にモデル化することで、推定精度を向上させることも今後の課題です。
url:
https://arxiv.org/abs/2306.11263
title:
The Dyson Equalizer: Adaptive Noise Stabilization for Low-Rank Signal Detection and Recovery
authors:
Boris Landa, Yuval Kluger
date:
30 July, 2024;

Comparative Analysis of Packages and Algorithms for the Analysis of Spatially Resolved Transcriptomics Data
目的:
この論文では、空間トランスクリプトミクスデータから空間的に変動する遺伝子(SVGs)を同定するための新しい手法や既存の手法の評価を行っています。また、空間オミクス技術の分析のための新しいフレームワークの開発にも焦点を当てています。
使用したデータや情報:
複数の異なる手法を用いてSVGsを同定するために、空間トランスクリプトミクスデータが使用されています。具体的には、Giotto、SpatialDE、Trendsceek、SPARKなどの既存の手法と、BinSpect-kmeansやBinSpect rankなどの新しい手法が評価されています。また、SquidpyフレームワークはPythonで開発され、空間オミクスデータの解析と視覚化のための共通ツールを提供しています。
新規性や解決できた問題:
新しい手法BinSpect-kmeansとBinSpect rankを導入し、これらは空間データからSVGsを同定するための新しいアプローチを提供します。また、SquidpyはGiottoよりも広範でモジュール式のアプローチを提供し、他のパッケージを容易に統合できるプリエクスティングフレームワークを持っています。これにより、空間オミクスデータの解析能力が向上しました。
未解決問題:
空間トランスクリプトミクスデータの解析において、さらに多くのSVGsを効率的に同定するための手法の改善が必要です。また、新しいフレームワークや手法の開発による解析ツールの統合と最適化も今後の課題です。さらに、異なる種類の空間オミクス技術に対応できる汎用性の高い解析ツールの開発も求められています。
url:
https://arxiv.org/abs/2108.01304
title:
Comparative Analysis of Packages and Algorithms for the Analysis of Spatially Resolved Transcriptomics Data
authors:
Natalie Charitakis, Mirana Ramialison, Hieu T. Nim
date:
3 August, 2021;

Exemplar Guided Deep Neural Network for Spatial Transcriptomics Analysis of Gene Expression Prediction
目的:
この論文の主な目的は、スライド画像ウィンドウからの遺伝子発現を正確に予測するためのEGNフレームワークを提案することです。このフレームワークは、ViTをバックボーンとして使用しながら、サンプル学習の概念を統合しています。
使用されたデータや情報:
この研究では、スライド画像ウィンドウからの遺伝子発現を予測するために、ViT(Vision Transformer)をバックボーンとして使用し、EBブロック(Exemplar Block)を用いてViTの表現を修正しました。また、教師なしのサンプル検索を行うために抽出器を使用し、スライド画像ウィンドウ間の類似性を評価するための表現空間を定義しました。
新規性や解決できた問題:
この研究の新規性は、遺伝子発現予測のためにViTとサンプル学習の概念を統合した点にあります。EBブロックを使用してViTの中間表現をサンプルのグローバルビューによって修正し、より正確な遺伝子発現予測を実現しました。これにより、従来の方法よりも優れた性能を示すことができました。
未解決問題:
将来的には、さらに多様なデータセットでのフレームワークの評価や、他の生物学的特徴の予測への応用など、EGNフレームワークの適用範囲を広げることが挑戦として残されています。また、EBブロックのさらなる最適化や、ViT表現の改善による予測精度の向上も重要な課題です。
url:
https://arxiv.org/abs/2210.16721
title:
Exemplar Guided Deep Neural Network for Spatial Transcriptomics Analysis of Gene Expression Prediction
authors:
Yan Yang, Md Zakir Hossain, Eric A Stone, Shafin Rahman
date:
29 October, 2022;

Concept Saliency Maps to Visualize Relevant Features in Deep Generative Models
目的:
この論文では、教師なし学習において重要な潜在表現を抽出する新しい手法を提案し、その有効性を示すことを目的としています。特に、生成モデルを用いて入力データの重要な領域や特徴を特定するコンセプトスコアとコンセプトサリエンシーマップを計算する方法に焦点を当てています。
使用されたデータや情報:
この研究では、大規模な顔画像データベースであるCelebAと、マウスの嗅覚球に関する空間トランスクリプトミクス(ST)データが使用されました。これらのデータを使って、特定の形態学的層に関連する遺伝子の表現プロファイルからコンセプトベクトルを形成し、サリエンシーマップを生成することで、データ内の重要な領域を強調表示しました。
新規性や解決できた問題:
この研究の新規性は、教師なし学習モデル、特に変分オートエンコーダ(VAE)を用いて、データから高レベルの概念を抽出し可視化する手法を提案した点にあります。具体的には、潜在空間におけるコンセプトベクトルのドット積を利用してコンセプトスコアを計算し、それを基にサリエンシーマップを生成することで、入力画像のどの部分が特定のコンセプトにとって重要かを明らかにしました。これにより、教師なし学習におけるデータ解釈の可能性を広げることができました。
未解決問題:
将来的には、空間遺伝子発現の潜在空間をさらに解明するために、STデータセットを使用した研究をさらに発展させる必要があります。また、形態学に直接関連しない機能注釈や他の高レベルの概念を用いて、特定の機能に対する空間的特性を明らかにすることが挑戦となります。さらに、STデータとRNAシークエンシングや分子実験を組み合わせることで、計算結果の検証を行うことがますます重要になるでしょう。
url:
https://arxiv.org/abs/1910.13140
title:
Concept Saliency Maps to Visualize Relevant Features in Deep Generative Models
authors:
Lennart Brocki, Neo Christopher Chung
date:
29 October, 2019;

Machine Learning for Uncovering Biological Insights in Spatial Transcriptomics Data
目的:
与えられた論文では、空間トランスクリプトミクスデータ(STデータ)を分析するための機械学習(ML)ツールの使用に関する機会、トレードオフ、および落とし穴について実用的な議論を提供しています。また、生物学的データサイエンスの四つの概念(正確性、解釈可能性、安定性、計算可能性)を適用し、STに関連する質問をより効果的に調査するためのMLツールと技術について説明しています。
使用されたデータや情報:
論文からは具体的なデータセットの詳細は提供されていませんが、空間トランスクリプトミクスデータ(STデータ)を分析するための機械学習ツールが用いられています。これには、空間的な細胞タイプの特徴付け、空間的なネットワーク、規制および相互作用の分析、空間的なクラスタリング、パターン、およびセグメンテーションなどが含まれます。
新規性や解決できた問題:
この論文では、機械学習を用いてSTデータから生物学的な質問に答える新しいアプローチを提供しています。具体的には、空間的な論文における細胞の挙動や相互作用を解析することで、従来の手法では捉えられなかった空間的なパターンやネットワークの理解を深めることが可能になります。
未解決問題:
今後取り組むべき未解決問題としては、さらなる高精度な解釈可能なモデルの開発、異なる種類のSTデータや他の生物学的データセットとの統合方法の改善、計算効率の向上、および機械学習モデルの一般化能力の向上が挙げられます。これらは、STデータからより詳細な生物学的洞察を引き出すために重要です。
url:
https://arxiv.org/abs/2303.16725
title:
Machine Learning for Uncovering Biological Insights in Spatial Transcriptomics Data
authors:
Alex J. Lee, Robert Cahill, Reza Abbasi-Asl
date:
29 March, 2023;

Unsupervised Classification for Tiling Arrays: ChIP-chip and Transcriptome
目的:
この研究の目的は、遺伝子や転移因子などの生物学的に興味深い領域の分類を行うための新しい統計的手法を提案することです。具体的には、プローブごとの結果ではなく、領域ごとの結果を導出する方法を開発し、異なる発現を示す遺伝子のリストを迅速に取得する手法を提供します。
使用したデータや情報:
この研究では、アラビドプシス・タリアナのトランスクリプトームおよびChIP-chipデータに基づいてNimbleGenタイリングアレイを用いたデータを分析しています。プローブの位置、クロモゾーム上の位置、プローブの現在のアノテーション(エキソン、イントロン、インターゲニック領域など)を含む全ての利用可能な情報を考慮しています。
新規性や解決できた問題:
従来の手法では個々のプローブに基づいて結果を導出していたのに対し、この研究では領域全体としての後方確率を計算し、非連結領域や遺伝子分類のための手順を含む新しい解決策を提案しています。これにより、プローブ分類から後から結果を導出するよりも、領域に基づいた計算が結果の改善につながることを示しています。
未解決問題:
この研究では、アノテーションなしのモデルが未知の転写サイトを検出するのに適していることが示されていますが、アノテーション情報を更新し続けることの重要性が指摘されています。また、異なる条件を比較する際のデータの大量かつ変動に対応する統計的手法の必要性が残されており、これらの課題に対処するためのさらなる研究が求められています。
url:
https://arxiv.org/abs/1104.5429
title:
Unsupervised Classification for Tiling Arrays: ChIP-chip and Transcriptome
authors:
Caroline Bérard, Marie-Laure Martin-Magniette, Véronique Brunaud, Sébastien Aubourg, Stéphane Robin
date:
28 April, 2011;

Emergent properties of collective gene expression patterns in multicellular systems
目的:
この研究では、異なる細胞間シグナリングルールがどのようにして質的に異なる組織タイプを安定化させるかを評価することを目的としています。具体的には、モデルのすべての側面を固定し、シグナリング行列Wだけを変更することで、異なる組織状態が自己組織化する範囲を探求しています。
使用したデータや情報:
この研究では、シングルセルトランスクリプトームデータを用いて細胞タイプ{ξµ}をエンコードし、それを基にして細胞内規則Jを設定しました。また、Wijを[-1,1]の範囲でランダムにサンプリングして異なるシグナリングルールを生成し、初期条件から自己組織化する組織を同定しました。
新規性や解決できた問題:
この研究の新規性は、細胞間のシグナリングルールの変更がどのように組織の自己組織化パターンに影響を与えるかを定量的に評価した点にあります。異なるシグナリングルールが細胞の集合体に与える影響を理解することで、組織の形成や機能についての新しい洞察を提供しました。
未解決問題:
将来的には、シグナリングフィールドが受信細胞の状態に依存するようなより複雑なシグナリング形式を探求する必要があります。また、実際の生物学的データからWを導出する方法についてもさらなる研究が必要です。これにより、モデルの生物学的妥当性を高め、より現実的な細胞間相互作用の理解に寄与することが期待されます。
url:
https://arxiv.org/abs/2110.07170
title:
Emergent properties of collective gene expression patterns in multicellular systems
authors:
Matthew Smart, Anton Zilman
date:
27 October, 2022;

Pseudo-Labeling Enhanced by Privileged Information and Its Application to In Situ Sequencing Images
目的:
この研究の主な目的は、半教師ありオブジェクト検出(SSOD)をバーコードコール問題に適用し、ラベルの少ない状況でのバーコードの認識と分類の精度を向上させることです。特に、プライベッジ情報を活用して、ノイズの多いラベルからの過学習を防ぎ、初期の決定境界を改善することを目指しています。
データや情報:
この研究では、特定のサイトからランダムに選択されたベンチマークデータセットのデータを利用しています。具体的には、イメージングの各サイクルで得られた前景オブジェクトの位置に関するラベルをコードブックと照らし合わせてバーコードシーケンスを形成することが挙げられます。また、実験的なイメージングノイズによって形成されたバーコードがコードブック内のバーコードと一致しない場合でも、そのバーコードがハミング空間内の地理的バーコードの近傍に留まると仮定しています。
新規性や解決できた問題:
この研究の新規性は、バーコードコール問題に半教師あり学習アプローチを適用した点にあります。特に、プライベッジ情報を用いることで、ラベルの少ない状況下でも高い精度でバーコードを識別できるようになります。また、従来の方法と比較して、バーコードの誤検出率を低減させることができました。
未解決問題:
今後の課題としては、さらに多様なデータセットに対する方法の適用や、より複雑なバーコードシナリオでの性能評価が挙げられます。また、プライベッジ情報のさらなる活用方法や、新たな半教師あり学習アルゴリズムの開発も重要な研究領域です。
url:
https://arxiv.org/abs/2306.15898
title:
Pseudo-Labeling Enhanced by Privileged Information and Its Application to In Situ Sequencing Images
authors:
Marzieh Haghighi, Mario C. Cruz, Erin Weisbart, Beth A. Cimini, Avtar Singh, Julia Bauman, Maria E. Lozada, Sanam L. Kavari, James T. Neal, Paul C. Blainey, Anne E. Carpenter, Shantanu Singh
date:
27 June, 2023;

Quantifying and Visualizing Hidden Preferential Aggregations Amid Heterogeneity
目的:
この論文は、NHS(Numericized Histogram Score)アルゴリズムを開発することを目的としています。このアルゴリズムは、画像内の異なるクラスのオブジェクトが非一様なパターンで配置されている場合の解析に役立ちます。特に、病理学者が腫瘍の断片における核のサブタイプの集積を視覚化する方法を提供することを意図しています。
使用したデータや情報:
この研究では、異なるタイプの画像データを用いています。これには、微生物の上皮細胞への侵入、神経前駆細胞の相互作用、腫瘍内の細胞系列の追跡、病原体との免疫細胞の相互作用、サブセルラーなタンパク質の局在、サンゴ礁の動植物の分布などが含まれます。また、ヒストグラムを0.0から1.0の範囲の連続変数に変換し、画像内の各オブジェクトを表すヒストグラムを飽和値で表現する技術を使用しています。
新規性や解決できた問題:
NHSアルゴリズムの新規性は、画像内のオブジェクト間の距離を数値化し、それを用いてオブジェクトの分布の形状を測定できる点にあります。これにより、特に腫瘍のヘマトキシリンとエオシン染色において、核の形態やクロマチンの染色密度に基づいて腫瘍のグレードを判定する際の病理学者の診断が精密化されます。従来、これらの微細ながら再発するクロマチンパターンに基づいて洗練された診断を行うことは困難でした。
未解決問題:
今後の課題としては、さらに多様な画像データに対するアルゴリズムの適用範囲を広げること、さらに詳細なパラメータ調整を通じてアルゴリズムの精度を向上させることが挙げられます。また、実際の臨床現場での応用に向けて、アルゴリズムの処理速度やユーザーフレンドリーなインターフェースの開発も重要です。
url:
https://arxiv.org/abs/1708.08097
title:
Quantifying and Visualizing Hidden Preferential Aggregations Amid Heterogeneity
authors:
David H Nguyen
date:
27 August, 2017;

All You Need is Color: Image based Spatial Gene Expression Prediction using Neural Stain Learning
目的:
この研究の目的は、組織サンプルの画像から、そのスポットにおける遺伝子の発現レベルを推定することです。この問題は、組織の染色度や染料吸収の程度が画像のピクセル値に変化をもたらすという仮説に基づいています。
使用されたデータや情報:
この研究では、組織サンプルのスキャンされた画像のRGB強度値を使用し、ビール・ランバートの法則に基づいて、特定のピクセルでの染料の吸光特性、組織サンプルに吸収された染料の量、および入射光の強度から、染色強度のベクトルを推定しました。また、ヘマトキシリン、エオシン、DABなどの標準的な染料に対応する脱色マトリックスと、画像内の染色変動を正規化する方法が文献で提供されています。
新規性や解決できた問題:
この研究の新規性は、ランダムに初期化された脱色マトリックスを使用し、入力画像の各ピクセル値を脱色して染色強度のベクトルを生成し、その染色脱色画像を使用して与えられたスポットに対応する遺伝子発現プロファイルを回帰する方法です。このアプローチにより、訓練データセット内の予測遺伝子発現値と目標遺伝子発現値の差の勾配を使用して、脱色マトリックスと回帰器のパラメータをエンドツーエンドで更新することが可能になりました。
未解決問題:
将来的には、さらに多様な組織サンプルや異なる染料を用いたデータに対しても、このモデルの適用性や精度を検証し、遺伝子発現の予測精度を向上させるための方法を開発する必要があります。また、異なる種類の癌やその他の疾患における遺伝子発現パターンの予測にこの技術を応用するための研究も必要です。
url:
https://arxiv.org/abs/2108.10446
title:
All You Need is Color: Image based Spatial Gene Expression Prediction using Neural Stain Learning
authors:
Muhammad Dawood, Kim Branson, Nasir M. Rajpoot, Fayyaz ul Amir Afsar Minhas
date:
26 August, 2021;

STGIC: a graph and image convolution-based method for spatial transcriptomic clustering
目的:
与えられた論文は、空間的なトランスクリプトーミクス技術を用いて、細胞レベルでの遺伝子発現の空間的なパターンを解析し、疾患の理解や治療法の開発に貢献することを目的としています。
使用されたデータや情報:
この論文では、空間的なトランスクリプトーミクスデータ、特にSlide-seqやStereo-seqなどの技術を用いて取得されたデータが使用されています。これにより、組織内の個々の細胞の遺伝子発現を空間的に解析することが可能になります。
新規性や解決できた問題:
与えられた論文の新規性は、高解像度での空間的な遺伝子発現パターンの詳細なマッピングを実現することにあります。これにより、細胞間の相互作用や組織内での遺伝子発現の微妙な変化をより詳細に理解することができ、それが疾患のメカニズムの解明につながります。
未解決問題:
将来的には、さらに多くのサンプルや異なる疾患条件でのデータを集め、データの解析方法を改善することで、より広範な疾患への適用可能性を高める必要があります。また、空間的なデータの解析を通じて得られる情報を臨床的な診断や治療にどのように統合するかという課題も残されています。
url:
https://arxiv.org/abs/2303.10657
title:
STGIC: a graph and image convolution-based method for spatial transcriptomic clustering
authors:
Chen Zhang, Junhui Gao, Lingxin Kong, Guangshuo cao, Xiangyu Guo, Wei Liu
date:
23 October, 2023;

Model-based Sparse Coding beyond Gaussian Independent Model
目的:
この論文の主な目的は、指数族分布に従うデータのための辞書更新アルゴリズムを提案することです。特に、αijとDの更新方法に焦点を当てています。
使用されたデータや情報:
この研究では、指数族分布を持つデータを使用しています。具体的には、ポアソン分布や二項分布が例として挙げられています。また、更新式の導出には、リンク関数の逆関数や、ディスパージョンパラメータなどの統計的特性が利用されています。
新規性や解決できた問題:
この研究の新規性は、指数族分布を持つデータに対する辞書学習アルゴリズムの提案にあります。従来の辞書学習手法はガウス分布を仮定していることが多い中、指数族分布というより広範な分布に適用可能な手法を開発しました。また、非線形のリンク関数に対応するための具体的な更新式の導出も行い、実際のデータに適用可能なアルゴリズムの形式を明確にしています。
未解決問題:
この研究では、非線形リンク関数を持つ一般的な分布に対する辞書の明示的な形式が得られにくいという問題が指摘されています。今後の課題として、より一般的な分布に対しても効率的かつ効果的に適用可能な辞書学習アルゴリズムの開発が求められます。さらに、提案されたアルゴリズムの収束性や効率性をさらに向上させるための研究も必要です。
url:
https://arxiv.org/abs/2108.09888
title:
Model-based Sparse Coding beyond Gaussian Independent Model
authors:
Xin Xing, Rui Xie, Wenxuan Zhong
date:
22 August, 2021;

Efficient Inference of Spatially-varying Gaussian Markov Random Fields with Applications in Gene Regulatory Networks
目的:
与えられた論文の主な目的は、がんや脳障害などの複雑な疾患を理解するために、生物学的および医学的データを利用して、空間的に変化するマルコフランダムフィールド(SV-MRFs)やグラフィカルモデルを推定する新しい手法やフレームワークを開発することです。これにより、疾患の進行や治療戦略の改善につながる洞察を提供することを目指しています。
使用データ・情報:
この論文では、がんの進行や脳の機能的接続性など、異なる生物学的および医学的データが利用されています。具体的には、腫瘍の成長や脳のMRIデータ、遺伝子発現プロファイルなどが含まれます。これらのデータを用いて、疾患の生物学的プロセスや空間的なパターンをモデル化し、病態の理解を深めるための計算手法が適用されています。
新規性と解決した問題:
与えられた論文の新規性は、大規模な生物学的データセットに対してスケーラブルで、統計的に強力な保証を持つ推論手法を提供することにあります。特に、空間的に変化するガウスマルコフランダムフィールド(GMRFs)の推定や、スパースな逆共分散推定問題の解法などが挙げられます。これにより、大規模な生物医学データにおいても効率的かつ効果的にネットワーク構造を推定することが可能になり、疾患のメカニズム解明に寄与しています。
未解決問題:
将来取り組むべき未解決問題としては、異なる生物学的状態や疾患の段階におけるモデルの適応性の向上、さらには異なる種類の生物学的データや臨床データを統合する方法の開発が挙げられます。また、推定されたモデルを用いた疾患の予防や治療戦略の具体的な応用に関する研究も重要です。これには、モデルの解釈性を向上させる研究や、実際の臨床現場での応用に向けた検証が必要です。
url:
https://arxiv.org/abs/2206.10174
title:
Efficient Inference of Spatially-varying Gaussian Markov Random Fields with Applications in Gene Regulatory Networks
authors:
Visweswaran Ravikumar, Tong Xu, Wajd N. Al-Holou, Salar Fattahi, Arvind Rao
date:
21 June, 2022;

DOT: A flexible multi-objective optimization framework for transferring features across single-cell and spatial omics
目的:
与えられた論文では、空間的に解決されたトランスクリプトームデータを用いて、異なる細胞集団間の構造的なデータマッチングを行うための新しい最適輸送(OT)の定式化を提案しています。この新しいアプローチは、特に部分的に不均衡なFused Gromov-Wasserstein(FGW)定式化を使用して、細胞の空間的な関係をより良く捉えることを目指しています。
使用したデータや情報:
この研究では、細胞の空間的な位置情報と遺伝子発現データを組み合わせた、空間的に解決されたシングルセルのトランスクリプトームデータを使用しています。具体的には、細胞と遺伝子のマッピングを行うために、細胞間および遺伝子間のペアワイズ不類似度を示すメトリクスMRとMSを用いています。
新規性と解決できた問題:
この研究の新規性は、部分的に不均衡なOT定式化を用いることで、異なる細胞集団のサイズが異なる場合でも、それぞれのスポットを最も近いサブ集団に単純に割り当てるという従来の方法の問題を克服しています。また、FGW定式化を採用することで、空間的な関係性をより詳細に捉えることが可能になり、より精度の高い細胞の位置関係の推定を実現しています。
未解決問題:
今後の課題としては、より大規模なデータセットに対するアプローチのスケーラビリティや、異なるタイプの生物学的サンプルに対する方法の適用性の向上が挙げられます。また、細胞のサブ集団の存在量に関する信頼性の高い情報がない場合の解析精度をさらに向上させるための研究が必要です。
url:
https://arxiv.org/abs/2301.01682
title:
DOT: A flexible multi-objective optimization framework for transferring features across single-cell and spatial omics
authors:
Arezou Rahimi, Luis A. Vale-Silva, Maria Faelth Savitski, Jovan Tanevski, Julio Saez-Rodriguez
date:
21 July, 2023;

PointFISH -- learning point cloud representations for RNA localization patterns
目的:
この研究の主な目的は、点群データを直接入力として使用し、連続的なベクトル表現を計算するモデルを訓練することです。この表現は、異なるRNA局在パターンの分類に使用されます。深層学習モデルは、満足のいくパフォーマンスを達成するために大量のアノテートされたデータを必要とする可能性があります。
使用データ・情報:
この研究では、PythonフレームワークであるFISH-quantを使用して、8種類の異なる局在パターン(ランダム、フォーカス、核内、核外、核の端、核周辺、細胞の端、細胞周辺)を持つデータセットをシミュレートしました。各パターンについて、1細胞あたり50から900のRNAを持つ20,000細胞をシミュレートし、合計160,000のシミュレート細胞を生成しました。
新規性・解決した問題:
この研究の新規性は、点群座標から直接RNA局在パターンを定量化する一般的な方法を提案した点にあります。従来の手作業による特徴設計を必要とせずに、シミュレーションされた局在パターンの座標を使用して、特定のニューラルネットワークを訓練することで、一般化能力を大幅に向上させることができました。また、シミュレーションデータをトレーニングに使用することで、まだ観察されていない新しい局在パターンに対するデータセットのクエリの機会を提供します。
未解決問題:
将来の課題としては、シミュレーションされたパターンが実際のデータとどの程度似ている必要があるか、また、異なるパターンや完全に異なるパターンに対しても情報的な表現が得られるかどうかを検証することが挙げられます。さらに、セルの形態やRNAの数などの潜在的な交絡因子を制御するための戦略をさらに洗練する必要があります。
url:
https://arxiv.org/abs/2302.10923
title:
PointFISH -- learning point cloud representations for RNA localization patterns
authors:
Arthur Imbert, Florian Mueller, Thomas Walter
date:
21 February, 2023;

A Model-free Variable Screening Method Based on Leverage Score
目的:
この研究の目的は、浸潤性がん領域と非浸潤性がん領域で高発現している遺伝子の機能を注釈し、これらの遺伝子が関与する生物学的プロセスを理解することです。また、異なる遺伝子発現分析ツールを用いて、がんの発展に寄与する可能性のある遺伝子や経路を同定し、それらの遺伝子の予測精度を評価することも目的としています。
使用されたデータや情報:
この研究では、非浸潤性がん領域と浸潤性がん領域での遺伝子発現データ(SCD、FGB、TGM2、FN1などの遺伝子)を用いました。また、遺伝子オントロジー連合を使用して遺伝子の機能を注釈し、DESeq2ツールやWLS(Weighted Least Squares)法、SIRS(Sure Independence Screening)法、DC-SIS(Dynamic Conditional Sure Independence Screening)法などの統計的手法を用いてデータ解析を行いました。
新規性や解決できた問題:
この研究の新規性は、特定の遺伝子(FGB、TGM2、FN1)が浸潤性がん領域で高発現しており、これらがアポトーシスプロセスに関与していることを明らかにした点にあります。また、異なる遺伝子発現分析ツールを比較し、WLS法が他の方法よりも予測精度が高いことを示しました。これにより、がんの診断や治療に役立つバイオマーカーの同定に貢献する可能性があります。
未解決問題:
将来的には、高発現遺伝子が具体的にどのようにがんの浸潤性を促進するかのメカニズムを詳細に解明する必要があります。また、これらの遺伝子が他のがん種においても同様の役割を果たしているかどうかを調査し、がん種を横断した一般的なバイオマーカーとしての可能性を探ることも重要です。さらに、新たに同定されたバイオマーカーを基にした治療法の開発も重要な課題です。
url:
https://arxiv.org/abs/2109.09936
title:
A Model-free Variable Screening Method Based on Leverage Score
authors:
Wenxuan Zhong, Yiwen Liu, Peng Zeng
date:
20 September, 2021;

SpaceTx: A Roadmap for Benchmarking Spatial Transcriptomics Exploration of the Brain
目的:
与えられた論文では、空間トランスクリプトミクスデータの処理と解析を効率的に行うための新しい方法やフォーマットを開発することを目的としています。特に、異なるラウンドとチャネルを通じて得られる画像データから、mRNAの位置や種類を特定し、細胞セグメンテーションを行い、遺伝子発現の空間的な分布を解析することが目標です。
使用されたデータや情報:
この論文では、多ラウンド、多チャネルの画像データ、DAPI画像、そして空間トランスクリプトミクス実験から得られるスポットバイジーン行列が使用されています。これらのデータは、細胞のセグメンテーションやタイプの割り当て、さらには遺伝子の空間的な位置の特定に用いられています。
新規性や解決できた問題:
この研究の新規性は、SpaceTxフォーマットとStarfishというツールを用いて、空間トランスクリプトミクスデータの統一された処理と解析を可能にした点にあります。これにより、異なる研究者が同じデータセットに対して再現可能で一貫した解析を行うことが可能となり、データの解釈の一貫性が向上しました。また、細胞セグメンテーションの方法として、DAPI画像に基づく方法と、スポットバイジーン行列を利用した拡張セグメンテーション方法が試され、異なる細胞タイプの境界をより正確に識別できるようになりました。
未解決問題:
未解決の問題としては、拡張セグメンテーション方法が特定の遺伝子や細胞タイプに依存しているため、データセットに含まれる遺伝子や細胞タイプによっては正確なセグメンテーションが難しい場合があります。また、データセットのサイズや遺伝子の数が増加するにつれて、計算の複雑性が増すため、計算資源の問題も残されています。将来的には、これらの問題に対処するためのより効率的なアルゴリズムや計算手法の開発が必要です。
url:
https://arxiv.org/abs/2301.08436
title:
SpaceTx: A Roadmap for Benchmarking Spatial Transcriptomics Exploration of the Brain
authors:
Brian Long, Jeremy Miller, The SpaceTx Consortium
date:
20 January, 2023;

Analyzing Lack of Concordance Between the Proteome and Transcriptome in Paired scRNA-Seq and Multiplexed Spatial Proteomics
目的:
この研究の主な目的は、単一細胞RNAシーケンシング(scRNA-Seq)と多重空間プロテオミクスデータ(CODEX)を用いて、免疫マーカーの遺伝子発現とタンパク質発現の間に見られる不一致を分析することです。これにより、遺伝子発現の調節とタンパク質機能の複雑さを理解する新たな洞察が得られることを目指しています。
使用したデータや情報:
この研究では、HuBMAPから得られたscRNA-SeqデータとCODEXデータを組み合わせて使用しています。これらのデータは同じドナーからの組織サンプルに基づいており、遺伝子発現マトリックスとして整理されています。また、CODEX画像とscRNA-Seqのカウントマトリックスデータを比較することで、バッチや技術的な効果による遺伝子発現のバーストの役割を探求しています。
新規性や解決できた問題:
この研究の新規性は、scRNA-SeqとCODEXという異なるプラットフォームを組み合わせることにより、遺伝子発現とタンパク質発現の間の不一致を詳細に分析することができる点にあります。これにより、遺伝子発現の調節機構や、免疫応答におけるタンパク質の役割についての理解が深まります。また、技術的なノイズやドロップアウトイベントがデータに与える影響を考慮に入れた解析を行うことで、より正確な生物学的洞察が可能になりました。
未解決問題:
将来的には、多重イメージング技術とscRNA-Seqを組み合わせることで、単一細胞レベルでの免疫応答の調節がどのように行われているかを詳細に理解することが挙げられます。特に、遺伝子発現の時間的変化を追跡し、転写バーストイベントを視覚化するための疑似時間アルゴリズムの使用が有望です。これにより、治療介入に対する洞察が得られる可能性があります。
url:
https://arxiv.org/abs/2307.00635
title:
Analyzing Lack of Concordance Between the Proteome and Transcriptome in Paired scRNA-Seq and Multiplexed Spatial Proteomics
authors:
Jai Prakash Veerla, Jillur Rahman Saurav, Michael Robben, Jacob M Luber
date:
2 July, 2023;

Spatial Transcriptomics Dimensionality Reduction using Wavelet Bases
目的:
与えられた論文では、空間転写法におけるウェーブレット変換を用いたデータの解析方法を提案し、その効果を検証することを目的としています。特に、非パラメトリックな方法としてウェーブレット変換がどのように有効に機能するかを探求しています。
使用データ・情報:
この論文では、空間的に解決された遺伝子発現データを用いています。具体的には、2次元の定期的に間隔を置いたデータ(画像データと同様)をウェーブレット変換によって解析しています。この過程で、隣接するデータペア間の差と和を計算し、ウェーブレット係数を求める手法が取り入れられています。
新規性と解決できた問題:
この研究の新規性は、空間転写データにウェーブレット変換を適用することにより、データの局所的な特徴を捉える能力が向上したことにあります。従来のフーリエ変換では全体的な影響を受けやすい問題を局所的な解析によって克服しています。また、ウェーブレット変換による正則化や平滑化を利用することで、過学習の問題の緩和が可能となりました。
未解決問題:
将来的には、ウェーブレット変換の閾値決定方法の最適化が課題として残されています。また、高次元データへの適用や、さらに精度の高い局所的特徴抽出の方法の開発も必要です。さらに、ウェーブレット変換を用いた解析手法が他の種類の生物学的データや異なる条件下でのデータに対してどのように適用可能かの検証も求められています。
url:
https://arxiv.org/abs/2205.11243
title:
Spatial Transcriptomics Dimensionality Reduction using Wavelet Bases
authors:
Zhuoyan Xu, Kris Sankaran
date:
19 May, 2022;

Predicting molecular phenotypes from histopathology images: a transcriptome-wide expression-morphology analysis in breast cancer
目的:
この研究は、乳癌のトランスクリプトーム全体にわたる表現型-遺伝子発現の関連性を評価し、個々の遺伝子レベルで最適化されたディープCNNモデルを用いて、乳癌の腫瘍レベルおよび空間的な遺伝子発現の予測を行うことを目的としています。
使用されたデータや情報:
この研究では、女性の乳癌患者から得られたデータを使用しています。具体的には、Clinseq-BC、TCGA-BC、ABiMの3つのデータソースからのデータが使用されており、これにはHE染色された病理組織学スライドのスキャン画像や、対応するRNA-seqデータが含まれています。また、画像はディープラーニングモデルのトレーニングに使用される前に、組織セグメンテーション、腫瘍注釈、タイリングなどの前処理が施されました。
新規性や解決できた問題:
この研究の新規性は、個々の遺伝子に対して最適化された17,695個の遺伝子特異的CNNモデルを開発し、これにより乳癌の腫瘍レベルおよび空間的な遺伝子発現の予測が可能になった点にあります。これまでの研究では、複数のがん種にまたがるモデルや、遺伝子間でのトランスファーラーニングに依存する方法が一般的でしたが、この研究ではそれぞれの遺伝子に対して個別に最適化されたモデルを使用することで、より具体的な形態学と遺伝子発現の関係をモデリングする能力を高めました。
未解決問題:
この研究は訓練データセットのサイズに限界があるため、より多くの訓練データを用いることで予測性能をさらに向上させる可能性があります。また、空間的に解決されたデータに対する予測の精度をさらに高めるための方法論の開発も、今後の課題として挙げられます。
url:
https://arxiv.org/abs/2009.08917
title:
Predicting molecular phenotypes from histopathology images: a transcriptome-wide expression-morphology analysis in breast cancer
authors:
Yinxi Wang, Kimmo Kartasalo, Masi Valkonen, Christer Larsson, Pekka Ruusuvuori, Johan Hartman, Mattias Rantalainen
date:
18 September, 2020;

Omni-Seg: A Scale-aware Dynamic Network for Renal Pathological Image Segmentation
目的:
この研究では、腎臓の病理画像における包括的な意味的セグメンテーションを行うことが目的です。具体的には、異なる組織タイプを異なる最適な解像度でセグメント化するために、複数のセグメンテーションネットワークを使用する代わりに、単一の動的ニューラルネットワークを使用して、複数の組織タイプと複数のスケールでの病理画像のセグメンテーションを実現することを目指しています。
使用したデータや情報:
この研究では、459枚のWSI(Whole Slide Image)から取得された1,751の関心領域(ROI)画像を使用しています。これらの画像は、125人の患者から得られ、ミニマルチェンジ病(Minimal Change Disease)を対象としています。画像は手動でセグメント化され、6つの構造的に正常な病理プリミティブにラベル付けされています。
新規性や解決できた問題:
この研究の新規性は、複数の組織タイプと複数のスケールをカバーする単一の動的ニューラルネットワーク(Omni-Seg)を提案している点にあります。従来の複数ネットワークを用いるアプローチとは異なり、このアプローチによりリソースの集約的な使用を避けつつ、組織タイプ間の空間的関係をモデリングすることが可能になります。また、人間の腎臓画像で訓練されたモデルをマウスの腎臓画像に直接適用することで、優れたスケール認識の一般化能力を示しました。
未解決問題:
現在のネットワークでは、WSIの各領域を最適な解像度にリサイズする必要があり、異なる解像度でセグメント化された組織の結果を最終的なマルチラベルセグメンテーションマスクに集約するプロセスが時間を要するため、テスト段階での計算時間が増加します。今後の研究では、デジタル病理学のデータセットの種類に対する提案方法の適用性を評価する必要があります。
url:
https://arxiv.org/abs/2206.13632
title:
Omni-Seg: A Scale-aware Dynamic Network for Renal Pathological Image Segmentation
authors:
Ruining Deng, Quan Liu, Can Cui, Tianyuan Yao, Jun Long, Zuhayr Asad, R. Michael Womick, Zheyu Zhu, Agnes B. Fogo, Shilin Zhao, Haichun Yang, Yuankai Huo
date:
18 January, 2023;

Breast Cancer Histopathology Image based Gene Expression Prediction using Spatial Transcriptomics data and Deep Learning
目的:
与えられた論文は、乳がんの組織生検のヘマトキシリンとエオシンで染色された組織像から遺伝子発現を予測することを目的としています。これにより、空間トランスクリプトミクスデータを使用して、高価な技術に頼ることなく、より広範囲の臨床腫瘍学研究で遺伝子発現情報を利用できるようにすることを目指しています。
使用したデータや情報:
この研究では、空間トランスクリプトミクスデータを使用し、250個の遺伝子の発現を予測するために10種類の最先端のディープラーニングモデルを訓練および評価しました。また、メインネットワークの一般化性能を向上させるために、補助ネットワークをフレームワークに導入しました。
新規性や解決できた問題:
この研究の新規性は、空間トランスクリプトミクスデータを用いて組織像から遺伝子発現を予測するディープラーニングフレームワーク「BrST-Net」を提案した点にあります。以前の研究では102個の遺伝子しか正の相関で予測できませんでしたが、この研究では237個の遺伝子を正の相関で同定し、中央値相関係数が0.50以上の遺伝子が24個あるという顕著な改善を達成しました。
未解決問題:
将来的には、さらに多くの遺伝子に対して高い精度での発現予測を実現すること、また、異なるタイプのがんや他の疾患に対しても同様のアプローチを適用することが挑戦として残されています。さらに、予測モデルの解釈可能性を向上させることも重要な課題です。
url:
https://arxiv.org/abs/2303.09987
title:
Breast Cancer Histopathology Image based Gene Expression Prediction using Spatial Transcriptomics data and Deep Learning
authors:
Md Mamunur Rahaman, Ewan K. A. Millar, Erik Meijering
date:
17 March, 2023;

Emerging Artificial Intelligence Applications in Spatial Transcriptomics Analysis
目的:
与えられた論文では、スペーシャルトランスクリプトミクス(ST)データの分析における新たな計算手法の必要性に応えるため、人工知能(AI)技術を用いた様々な機械学習およびディープラーニング技術を活用しています。これにより、STデータの解析を効率的かつ正確に行うことが目的です。
使用されたデータや情報:
文献レビューからは、スペーシャルトランスクリプトミクスデータを解析するための様々なAI手法が用いられていることが示されています。具体的なデータとしては、STデータ、シングルセルトランスクリプトミクスデータ、そしてこれらを組み合わせたマルチオミクスデータが含まれています。これらのデータを用いて、細胞間のコミュニケーションや細胞の空間的な配置を解析しています。
新規性や解決できた問題:
この論文での新規性は、スペーシャルトランスクリプトミクスデータの解析においてAI技術を活用することにあります。これにより、高コストな実験を行わずに、がん組織の特徴をより正確に把握することが可能になります。また、ディープラーニングを用いた方法で、画像認識技術を応用して細胞の空間的な配置や細胞間の相互作用を解析することができるようになりました。
未解決問題:
未解決の問題としては、さらなる精度向上と計算効率の向上が挙げられます。特に、異なるタイプのデータソースを統合する際の精度の向上や、大規模なデータセットに対するスケーラビリティの問題があります。また、解釈可能性を高めるための研究も重要であり、AIモデルがどのようにしてその結果を導き出しているのかを理解することも今後の課題です。
url:
https://arxiv.org/abs/2203.09664
title:
Emerging Artificial Intelligence Applications in Spatial Transcriptomics Analysis
authors:
Yijun Li, Stefan Stanojevic, Lana X. Garmire
date:
17 March, 2022;

Image Varifolds on Meshes for Mapping Spatial Transcriptomics
目的:
この論文では、画像の変形と登録を通じて、異なるモダリティやスケール間でのデータの整合性を向上させることを目的としています。具体的には、遺伝子、細胞、組織データをアトラス座標に変換することにより、異なるスケールのデータを統合し、より詳細な生物学的解釈を可能にすることを目指しています。
使用されたデータや情報:
この研究では、空間的に解決されたトランスクリプトミクスデータや、ヒトデジタル病理学からのヒストロジカルマイクロスケールマーカーなど、高解像度の遺伝子特徴を含むデータを使用しています。これらのデータは、画像変形や登録のプロセスを通じて、ティッシュスケールのアトラス座標にマッピングされます。
新規性や解決できた問題:
この研究の新規性は、異なるスケールとモダリティのデータを統合するための画像変形技術の応用にあります。具体的には、マイクロスケールの機能的特徴をティッシュスケールのアトラスラベルにマッピングする新しい方法を提案しています。これにより、異なるタイプの生物学的データ間での相互理解が深まり、より精密な生物医学的分析が可能になります。
未解決問題:
未解決の問題としては、さらに異なる種類の生物学的データや、より複雑な生物学的システムに対するこの技術の適用が挙げられます。また、変形アルゴリズムの精度向上や、より高速な計算方法の開発も求められています。これらの課題に取り組むことで、生物学的データの解釈と利用の幅がさらに広がることが期待されます。
url:
https://arxiv.org/abs/2208.08376
title:
Image Varifolds on Meshes for Mapping Spatial Transcriptomics
authors:
Michael I Miller, Alain Trouvé, Laurent Younes
date:
17 December, 2022;

Spatial mapping of protein composition and tissue organization: a primer for multiplexed antibody-based imaging
目的:
与えられた論文は、高度に多重化された抗体ベースのイメージング実験のための抗体の検証と選択に関する例を示すことを目的としています。このような実験では、異なるプラットフォーム間で検証されたヒトおよびマウスの抗体クローンを使用して、正確で信頼性の高いデータを得ることが重要です。
使用されたデータや情報:
この論文では、多重抗体ベースのイメージング技術、遺伝子およびタンパク質データベース、抗体検索エンジンの比較、最小限の抗体メタデータ、組織の自己蛍光を制御する戦略、および多重イメージングデータの状態に関する情報が用いられています。これにより、高度に多重化されたイメージングプラットフォームでの抗体クローンの検証が行われています。
新規性や解決できた問題:
この論文の新規性は、異なるイメージングプラットフォーム間での抗体クローンの検証に関する包括的な情報を提供することにあります。これにより、研究者は特定のイメージング実験に最適な抗体を選択することができ、より正確で再現性の高い結果を得ることが可能になります。また、抗体の選択と検証に関する明確なガイドラインと基準を提供することで、研究の質を向上させることができます。
未解決問題:
将来的には、さらに多くの抗体クローンを異なるプラットフォームで検証する必要があります。また、新しいイメージング技術や抗体が開発されるにつれて、これらの技術に適合する新しい抗体の開発と検証が継続的に必要になります。さらに、データ共有と透明性をさらに向上させるための基準やガイドラインの更新も重要です。
url:
https://arxiv.org/abs/2107.07953
title:
Spatial mapping of protein composition and tissue organization: a primer for multiplexed antibody-based imaging
authors:
John W. Hickey, Elizabeth K. Neumann, Andrea J. Radtke, Jeannie M. Camarillo, Rebecca T. Beuschel, Alexandre Albanese, Elizabeth McDonough, Julia Hatler, Anne E. Wiblin, Jeremy Fisher, Josh Croteau, Eliza C. Small, Anup Sood, Richard M. Caprioli, R. Michael Angelo, Garry P. Nolan, Kwanghun Chung, Stephen M. Hewitt, Ronald N. Germain, Jeffrey M. Spraggins, Emma Lundberg, Michael P. Snyder, Neil L. Kelleher, Sinem K. Saka
date:
16 July, 2021;

Single Cells Are Spatial Tokens: Transformers for Spatial Transcriptomic Data Imputation
目的:
この論文は、トランスフォーマーベースの空間トランスクリプトミクスのインピュテーションフレームワークであるSpaFormerを提案し、細胞レベルでの空間情報のエンコーディングとトランスフォーマーの訓練方法に関する二つの主要な疑問に答えることを目的としています。また、新しい二段階マスキング技術を導入し、一般的なオートエンコーダーフレームワークに組み込む方法も提案しています。
使用データ・情報:
この研究では、空間トランスクリプトミクスデータを用いています。具体的には、肝臓、肺、腎臓のデータセットを使用し、これらのデータセットで位置エンコーディングの性能を比較しました。また、異なるオートエンコーダーモデルのバリエーションについても検討しています。
新規性と解決した問題:
この研究の新規性は、空間トランスクリプトミクスデータのためのトランスフォーマーベースのインピュテーションフレームワークを提案した点にあります。また、新しい二段階マスキング技術を導入し、これがオートエンコーダーベースのモデルにどのように組み込まれるかを示しました。これにより、欠損値の回復とクラスタリング構造の両方で既存の方法よりも優れた性能を示すことができました。
未解決問題:
位置エンコーディングに関しては、トランスフォーマーにおける位置エンコーディングの探索にまだ大きな余地があると指摘しています。特に、位置エンコーディングがトランスフォーマーの性能に与える影響は予想よりも小さいことが示されており、これをどのように改善するかが今後の課題とされています。
url:
https://arxiv.org/abs/2302.03038
title:
Single Cells Are Spatial Tokens: Transformers for Spatial Transcriptomic Data Imputation
authors:
Hongzhi Wen, Wenzhuo Tang, Wei Jin, Jiayuan Ding, Renming Liu, Xinnan Dai, Feng Shi, Lulu Shang, Hui Liu, Yuying Xie
date:
16 February, 2024;

REFINED (REpresentation of Features as Images with NEighborhood Dependencies): A novel feature representation for Convolutional Neural Networks
目的:
本論文は、高次元ベクトルを画像に変換し、それを畳み込みニューラルネットワーク(CNN)の入力として使用する新しいアプローチ、REFINEDを提案しています。この方法は、空間的近傍依存性を持つ画像へと高次元ベクトルをマッピングすることにより、ディープラーニングCNNを用いた自動特徴抽出を可能にすることを目的としています。
使用データ・情報:
本研究では、NCIデータセットに含まれる薬物に関するデータを用いて、異なる初期化方法と次元削減技術を用いて生成された画像に基づいてCNNを訓練しました。具体的には、Isomap、Bayesian MDS、LLE、LEなどの次元削減技術を用いて、特徴のEuclidean距離行列を最小化することを目的としたヒルクライミング手法を適用しました。
新規性・解決問題:
REFINEDアプローチの新規性は、高次元データを空間的近傍依存性を持つ画像に変換することで、CNNを用いた効果的な特徴抽出を実現する点にあります。これにより、従来の高次元ベクトルを直接入力とする場合に比べて、予測精度が向上することが示されました。また、この研究は、異なる初期化と次元削減技術の影響を定量的に評価し、ヒルクライミングによる非重複ピクセル位置の割り当てが性能向上に寄与することを明らかにしました。
未解決問題:
将来的には、さらに多様なデータセットに対するREFINEDの適用や、他の種類のディープラーニングアーキテクチャとの組み合わせによる性能評価が必要です。また、異なる次元削減技術が特定のタイプのデータに対してどのように最適化されるかをさらに研究する必要があります。これにより、REFINEDアプローチの一般化能力と適用範囲を広げることができるでしょう。
url:
https://arxiv.org/abs/1912.05687
title:
REFINED (REpresentation of Features as Images with NEighborhood Dependencies): A novel feature representation for Convolutional Neural Networks
authors:
Omid Bazgir, Ruibo Zhang, Saugato Rahman Dhruba, Raziur Rahman, Souparno Ghosh, Ranadip Pal
date:
15 May, 2020;

Modeling Dense Multimodal Interactions Between Biological Pathways and Histology for Survival Prediction
目的:
与えられた論文は、がんの患者の生存予測を改善することを目的としています。特に、組織学的画像と遺伝子情報を組み合わせたマルチモーダルなアプローチを用いて、がんの診断と予後予測の精度を向上させることを目指しています。
使用したデータや情報:
この研究では、組織学的画像(Whole Slide Images, WSI)と遺伝子情報(transcriptomics)を使用しています。これらのデータは、がんの患者から得られたもので、それぞれががんの特性を異なる側面から捉えています。組織学的画像はがん細胞の形態や構造を、遺伝子情報はがん細胞の分子的特性を反映しています。
新規性と解決できた問題:
この研究の新規性は、組織学的画像と遺伝子情報を統合することにより、それぞれのデータソースから得られる情報を補完しあいながら予測精度を向上させる点にあります。具体的には、SURVPATHという新しいモデルを提案しており、これによりマルチモーダルなデータを効果的に統合し、生存予測の精度を向上させることができました。また、異なる拡大倍率での画像解析においても一貫した性能を示しており、モデルのロバスト性が確認されています。
未解決問題:
将来取り組むべき未解決問題としては、より多様ながんタイプや進行段階に対するモデルの適用性の検証、さらには治療法の選択や治療反応の予測への応用が挙げられます。また、データの異質性や高次元性に対処するためのさらなるアルゴリズムの改善も必要です。これには、新しいデータ融合技術や学習手法の開発が求められるでしょう。
url:
https://arxiv.org/abs/2304.06819
title:
Modeling Dense Multimodal Interactions Between Biological Pathways and Histology for Survival Prediction
authors:
Guillaume Jaume, Anurag Vaidya, Richard Chen, Drew Williamson, Paul Liang, Faisal Mahmood
date:
15 April, 2024;

Co-clustering of Spatially Resolved Transcriptomic Data
目的:
この論文では、空間的に解決されたトランスクリプトームデータの共クラスタリングに関する問題に取り組んでいます。具体的には、SpaRTaCoというアルゴリズムを使用して、遺伝子発現データの空間的な変動を考慮したクラスタリングを行うことを目的としています。
使用したデータや情報:
この研究では、空間的に解決された遺伝子発現データを使用しています。具体的には、異なる遺伝子の共分散行列をWishart分布から生成し、これを用いてシミュレーション実験を行っています。また、クラスタリングの不確実性を評価するために、クラスタリングエラーレート(CER)を用いています。
新規性や解決できた問題:
この研究の新規性は、空間的な共分散を考慮した新しい共クラスタリングアルゴリズム(SpaRTaCo)を提案している点にあります。これにより、空間的に異なるパターンを示す遺伝子発現データのクラスタリングが可能になり、より正確な生物学的解釈が期待できます。また、クラスタリングの不確実性を定量的に評価する方法も提案されています。
未解決問題:
将来的には、より複雑な空間構造を持つデータや、異なる種類の生物学的条件を考慮したモデルの拡張が必要です。また、計算時間を短縮するための効率的なアルゴリズムの開発も重要な課題です。さらに、実際の生物学的データセットに対するアルゴリズムの適用とその解釈に関する研究も必要です。
url:
https://arxiv.org/abs/2110.04872
title:
Co-clustering of Spatially Resolved Transcriptomic Data
authors:
Andrea Sottosanti, Davide Risso
date:
14 September, 2022;

Bayesian Flexible Modelling of Spatially Resolved Transcriptomic Data
目的:
与えられた論文の主な目的は、異なる遺伝子数、空間位置の数、およびMate´rnカーネルの範囲を使用して、真の行相関のスケール行列の異なる選択に対して推定された相関行列を使用して、KLダイバージェンス(対数スケール)と相対フロベニウス誤差のための二つの方法の評価を行うことです。
データや情報:
この研究では、異なる遺伝子数(100、200、500など)、空間位置の数、そしてMate´rnカーネルの範囲を変化させたシミュレーションデータを使用しています。また、真の行相関のスケール行列の異なる選択肢(AR、Equi、Bandedなど)に基づいて相関行列が推定されています。
新規性や解決できた問題:
この研究の新規性は、大規模な遺伝子発現データセットにおける空間的相関の推定とモデリングに関するものであり、異なるスケール行列の選択が結果にどのように影響するかを評価することにあります。解決された問題は、大規模な空間的データセットにおける相関行列の推定の精度を向上させることであり、これによりより正確な遺伝子発現の空間的パターンの理解が可能になります。
未解決問題:
今後取り組むべき未解決の問題として、さらに異なるタイプのスケール行列の選択肢を探求し、より多様な生物学的状況に適用可能なモデルを開発することが挙げられます。また、実際の生物学的データセットに適用した場合の方法の有効性を検証し、改善する必要があります。
url:
https://arxiv.org/abs/2305.08239
title:
Bayesian Flexible Modelling of Spatially Resolved Transcriptomic Data
authors:
Arhit Chakrabarti, Yang Ni, Bani K. Mallick
date:
14 May, 2023;

Multiscale topology classifies and quantifies cell types in subcellular spatial transcriptomics
目的:
与えられた論文では、多パラメータ持続ホモロジーという数学的ツールを使用して、データ内の位相的特徴がパラメータの値が変化するにつれてどのように現れ、消えるかを追跡することを目的としています。特に、免疫細胞の空間分布に関するアプリケーションに焦点を当てています。
使用したデータや情報:
この研究では、Vipondによる多パラメータ持続性ランドスケープを使用し、多パラメータ持続ホモロジーの理論についての議論や、免疫細胞の空間分布に関するアプリケーションの探求が行われました。具体的なデータセットの詳細は記載されていませんが、一般的には点雲データが位相空間の解析に用いられています。
新規性や解決できた問題:
多パラメータ持続ホモロジーを用いることで、一般的な持続ホモロジーでは扱えない複数のスケールやパラメータにわたるデータの位相的特徴を追跡できるようになります。これにより、データのより詳細な解析が可能になり、例えば異常値の影響を軽減することができます。また、免疫細胞の空間分布のような複雑な生物学的データの解析に新たな洞察を提供することができました。
未解決問題:
多パラメータ持続ホモロジーは理論的には有効ですが、計算コストが高いという問題があります。また、複数のパラメータを持つデータセットに対する解析手法としての一般化や、より効率的なアルゴリズムの開発が今後の課題です。さらに、実際の生物学的データセットに対する適用例を増やし、その有効性を広く検証する必要があります。
url:
https://arxiv.org/abs/2212.06505
title:
Multiscale topology classifies and quantifies cell types in subcellular spatial transcriptomics
authors:
Katherine Benjamin, Aneesha Bhandari, Zhouchun Shang, Yanan Xing, Yanru An, Nannan Zhang, Yong Hou, Ulrike Tillmann, Katherine R. Bull, Heather A. Harrington
date:
13 December, 2022;

Nonnegative spatial factorization
目的:
この論文では、空間転写データを解析し、遺伝子の発現の変動を空間的および非空間的要因に分解することを目的としています。SPDEスタイルとLDAスタイルのポストプロセッシングを用いて、遺伝子や観測データの空間的重要度スコアを計算し、データの解釈を助けることが目的です。
使用データ・情報:
この研究では、空間的因子行列と対応するローディング、非空間的因子と対応するローディングを含む複数の行列データを使用しています。これらのデータは、遺伝子の発現データとして解釈され、空間的および非空間的要素によってその変動が説明されます。
新規性・解決された問題:
この研究の新規性は、空間的および非空間的因子を用いて遺伝子の発現データを解析する手法を提案している点にあります。特に、SPDEスタイルのポストプロセッシングを用いて空間的要因による遺伝子の発現の変動を定量化し、遺伝子の空間的重要度を評価することができるようになりました。これにより、空間的転写データの解釈が向上しました。
未解決問題:
将来的には、より多様な空間的パターンや複雑な生物学的条件を考慮したモデリングの拡張が必要です。また、計算効率をさらに向上させる方法や、異なる種類の空間的データに対応できる汎用的なアプローチの開発も求められています。これらの問題に取り組むことで、空間転写データの解析の精度と適用範囲をさらに拡大することができるでしょう。
url:
https://arxiv.org/abs/2110.06122
title:
Nonnegative spatial factorization
authors:
F. William Townes, Barbara E. Engelhardt
date:
12 October, 2021;

Active feature selection discovers minimal gene sets for classifying cell types and disease states with single-cell mRNA-seq data
目的:
与えられた論文の目的は、特定の科学的または技術的問題を解決するための新しい方法論や理論を提案し、検証することです。例えば、文献[47]では、免疫細胞におけるペスト受容体FPR1を特定し、その役割を解明することが目的です。また、文献[48]では、肺腫瘍の免疫応答に関わる新しい長鎖非コーディングRNAを特定することが目的です。
使用されたデータや情報:
各研究では、異なる種類のデータや情報が用いられています。例えば、文献[47]では実験的な方法により免疫細胞からデータを収集し、FPR1の役割を解析しています。文献[48]では、RNAシーケンシングデータを用いて、肺腫瘍における免疫応答に関与する長鎖非コーディングRNAを特定しています。
新規性や解決できた問題:
各研究は、それぞれの分野で新規性を持っています。文献[47]では、免疫細胞のペスト受容体としてFPR1を初めて特定し、その機構を明らかにしました。文献[48]では、肺腫瘍の免疫応答における新しい長鎖非コーディングRNAの役割を解明し、新たな治療標的の可能性を示唆しました。
未解決問題:
これらの研究で明らかになった知見に基づき、さらなる詳細な機構の解析や、他の疾患への応用可能性の検討が必要です。また、新たに特定された分子や受容体の臨床応用に向けた安全性や効果の検証が求められます。具体的には、FPR1の他の疾患における役割や、新しく特定された長鎖非コーディングRNAが他のがん種においても同様の役割を果たすかどうかの検証が挙げられます。
url:
https://arxiv.org/abs/2106.08317
title:
Active feature selection discovers minimal gene sets for classifying cell types and disease states with single-cell mRNA-seq data
authors:
Xiaoqiao Chen, Sisi Chen, Matt Thomson
date:
12 February, 2022;

Challenges and opportunities to computationally deconvolve heterogeneous tissue with varying cell sizes using single cell RNA-sequencing datasets
目的:
この論文では、組織処理プロトコルが参照アトラス(Z)に与える影響を評価し、特に単一核(sn)対単一細胞(sc)RNA-シークエンシングプロトコルの違いがどのようにデータ取得に影響するかを検討しています。また、これらのバイアスを理解し、解消するための新しい計算手法の開発にも焦点を当てています。
使用されたデータや情報:
この研究では、人間の脳の参照データセットとして、主に新鮮凍結された死後の脳組織から得られたデータを使用しています。単一核と単一細胞のRNAシークエンスデータの両方が利用され、これにより核のトランスクリプトームが全細胞のトランスクリプトームをどの程度代表しているかが評価されています。また、異なる分離プロトコルが平均核数に与える影響や、異なるシークエンシングプラットフォームが参照遺伝子発現プロファイルに与える影響も検討されています。
新規性や解決できた問題:
この研究の新規性は、単一核と単一細胞のRNAシークエンシングデータを比較することで、組織処理プロトコルが参照アトラスに与えるバイアスを詳細に評価し、それに基づいてデータの解釈を改善する方法を提供する点にあります。また、核のトランスクリプトームが全細胞のトランスクリプトームをどの程度代表するかを科学的に評価し、新しい計算手法を用いてプロトコル特有のバイアスを取り除くアプローチを開発したことも重要な進展です。
未解決問題:
未解決の問題としては、核のトランスクリプトームが細胞質コンパートメントの特定のトランスクリプトを含まない可能性があるため、これらのトランスクリプトが生物学的機能にどのように寄与しているかを解明する必要があります。また、異なるシークエンシングプラットフォーム間でのデータの一貫性をさらに向上させるための方法や、より多様な組織や条件からのデータを統合する効果的な手法の開発も今後の課題です。
url:
https://arxiv.org/abs/2305.06501
title:
Challenges and opportunities to computationally deconvolve heterogeneous tissue with varying cell sizes using single cell RNA-sequencing datasets
authors:
Sean K. Maden, Sang Ho Kwon, Louise A. Huuki-Myers, Leonardo Collado-Torres, Stephanie C. Hicks, Kristen R. Maynard
date:
10 May, 2023;

A Markov random field-based approach to characterizing human brain development using spatial-temporal transcriptome data
目的:
この研究の主な目的は、人間の脳の発達を特徴づけるために、空間的・時間的な遺伝子発現データを用いたマルコフランダムフィールドベースのアプローチを提案することです。具体的には、各時期および各脳領域で発現/未発現の遺伝子を特定し、時間を追って異なる脳領域での遺伝子の発現差を識別することを目的としています。
使用したデータや情報:
この研究では、脳領域間の遺伝子発現レベルの高い相関を示す空間的類似性と時間的依存性を利用しています。具体的には、ガウス混合モデルを用いて発現および未発現遺伝子を識別し、局所的な偽発見率(f.d.r.)フレームワークを使用して時間的に隣接する期間間での差異発現遺伝子(DE genes)を識別しています。
新規性や解決できた問題:
この研究の新規性は、空間的類似性と時間的依存性を同時に考慮することにより、データから生物学的に意味のある結果をより効果的に抽出する点にあります。従来の方法と比較して、このアプローチは脳の各領域と各時期における遺伝子の発現状態をより正確に評価できるようになりました。
未解決問題:
未解決の問題としては、このアプローチが他の生物学的条件や異なる種のデータにどの程度適用可能かが挙げられます。また、より大規模なデータセットに対する計算効率やスケーラビリティの向上が必要です。さらに、遺伝子発現データに含まれるノイズの影響をさらに低減する方法の開発も重要な課題です。
url:
https://arxiv.org/abs/1506.00480
title:
A Markov random field-based approach to characterizing human brain development using spatial-temporal transcriptome data
authors:
Zhixiang Lin, Stephan J. Sanders, Mingfeng Li, Nenad Sestan, Matthew W. State, Hongyu Zhao
date:
1 June, 2015;

Graph Neural Operators for Classification of Spatial Transcriptomics Data
目的:
この研究の主な目的は、空間トランスクリプトミクスデータを用いて、マウスの脳組織サンプルの脳領域を予測するための堅牢な機械学習アーキテクチャを特定することです。具体的には、さまざまなグラフニューラルネットワークアプローチを使用して、ニューラルオペレーターを適用することの有効性を検証することを目指しています。
データや情報:
研究では、マウスの脳アトラスデータセットを使用しました。このデータセットには約34,000のスポットと23,000の遺伝子が含まれており、75のサンプルがあります。このデータはIlluminaの空間トランスクリプトミクスプロファイリング技術によってプロファイルされ、分子的に異なるサブリージョンの空間的な組織を定義する遺伝子発現シグネチャが含まれています。
新規性や解決できた問題:
この研究の新規性は、空間トランスクリプトミクスデータを用いて、部分微分方程式を用いて関数から関数へのマッピングを学習するニューラルオペレーターを適用することにあります。特に、グラフニューラルオペレーターを用いてこのマッピングを学習し、他のベースラインやグラフネットワークアプローチよりも優れた性能を示しました。F1スコアは約72%で、これは他のアプローチを上回る結果でした。
未解決問題:
将来的には、さらに高度なニューラルオペレーターアプローチを検討することが挙げられます。例えば、カーネル近似としてトランスフォーマーを使用するなど、最先端のアーキテクチャを取り入れることが考えられます。また、異なる解像度においても一般化能力を持つロバストなオペレーターの開発が今後の課題です。
url:
https://arxiv.org/abs/2302.00658
title:
Graph Neural Operators for Classification of Spatial Transcriptomics Data
authors:
Junaid Ahmed, Alhassan S. Yasin
date:
1 February, 2023;

この記事が気に入ったらサポートをしてみませんか?