マイクロアレイやRNA-Seqデータの解析

マイクロアレイやRNASeqなどの発現データのダウンロード。

NCBIのGEOのサイト
http://www.ncbi.nlm.nih.gov/geo/

'Search for Gene Expression at GEO Profiles'をクリックして、'GEO DataSets'タブを選んで、論文に掲載されているGSEコードを入力すると、実験のページに移動する。

いくつかのファイルへのリンクが表示される。

Platform (GPL...): アレイの種類。Affymetrix Array(どのスポットにどの遺伝子が載っているかといった情報)

Samples (GSM...): 各々のサンプルのデータ

GSE..... _RAW.tar をクリックすれば、全サンプルの生データをダウンロードできます。

各々のサンプルのファイルは、Affymetrix Probe Results File(.CEL形式ファイル)になっているので、multi-aff-pyなどのソフトウェアが必要です。

Series Matrix File(s)で.txtファイルをダウンロードすれば、データをまとめてcsvテキスト形式でダウンロードできます。

そのままでは .txt ファイルなので、.csvと変換すれば、Excel 2008などの表計算ソフトで解析できます。

この記事が気に入ったらサポートをしてみませんか?