見出し画像

シングルセルATAC-seq: 遺伝子発現の向こう側へ

シングルセルRNA-seq解析は生命科学研究に革命をもたらし、すでに大規模なデータセットが日々蓄積されています。一方で、シングルセル解析はRNAだけでなく他にもさまざまな分子を測定する方法が開発されています。

私は今でこそシングルセルRNA-seq解析に取り組んでいますが、はじめはシングルセルATACシーケンスからこの世界に入りました。意味もわからず苦戦に苦戦を重ねてSnapATACのチュートリアルをやっていた2020年の夏が懐かしいです。

シングルセルATACシーケンスは、個々の細胞レベルでのクロマチンのアクセシビリティを調べるための革新的な技術です。平たく言えば、開いている≒使われているクロマチン領域をシングルセルレベルで知ることのできる技術です。

今日はこのシングルセルATAC-seqについて簡単にご紹介します。

まず、ATACシーケンス(Assay for Transposase-Accessible Chromatin with high-throughput sequencing)とは、クロマチンのアクセス可能な領域を識別する手法です。これは、クロマチンの開いている領域が遺伝子の発現にどのように影響するかを理解するために使われます。通常のATACシーケンスでは、多くの細胞から抽出されたDNAを使用しますが、シングルセルATACシーケンスでは、一つ一つの細胞から得られたDNAを分析します。

シングルセルATACシーケンスのプロセスは、まず個々の細胞を隔離し、それぞれの細胞核にトランスポゼースを導入することから始まります。トランスポゼースは、開いているクロマチン領域に特異的に組み込まれ、そこから切り出されたDNAフラグメントがシーケンスされます。このシーケンシングにより、各細胞のクロマチンのアクセス可能な領域が特定されます。

この技術の大きな利点は、遺伝子発現そのものではなく、遺伝子発現制御を担う種々の非コード領域の状態について評価できることです。プロモーターやエンハンサーの状態をシングルセルレベルで解析することで、細胞集団全体ではなく、細胞間での遺伝子発現制御機構の違いを詳細に把握できることです。シングルセルRNA解析と比較すると、RNAはRNA発現の数値しか得られない一方で、ATACでは遺伝子座のアクセシビリティを数値化した推定発現量、エンハンサーなど遠位調節領域のアクセシビリティ、転写因子モチーフの活性度など、一つのデータセットから複数のメトリクスを算出可能で、解釈に極めて大きな幅を与えてくれます。

このように書くと、シングルセルATAC-seqが優れているように思えるのですが、難しいところもあります。ATACに限らずシングルセルエピゲノム解析で問題になるのが、得られた行列が非常に疎な行列である、ということです。シングルセルRNAでは、細胞x遺伝子、かつ連続した値が入る行列が生成されますが、シングルセルATACはゲノムが開いているか閉じているかなので、ゲノムは2コピーですので、基本的には0か1か2しか入りません。しかも0は検出できていないのか閉じているのか区別できません。

こうなるとシングルセルATAC-seqはRNAのように解析してはならないことが容易に想像できると思います。私が使用しているパッケージ、ArchRはこの問題をとてもエレガントに解決しています。これについてはまた今度ご紹介したいと思います。

シングルセルRNA-seqより少し敷居は高いですが、活用できる公共データも増えているのでぜひ興味を持っていただけたらと思います。

それでは、楽しいシングルセル解析ライフを!

この記事が気に入ったらサポートをしてみませんか?