マイクロアレイやRNA-Seqデータの解析
マイクロアレイやRNASeqなどの発現データのダウンロード。
NCBIのGEOのサイト
http://www.ncbi.nlm.nih.gov/geo/
'Search for Gene Expression at GEO Profiles'をクリックして、'GEO DataSets'タブを選んで、論文に掲載されているGSEコードを入力すると、実験のページに移動する。
いくつかのファイルへのリンクが表示される。
Platform (GPL...): アレイの種類。Affymetrix Array(どのスポットにどの遺伝子が載っているかといった情報)
Samples (GSM...): 各々のサンプルのデータ
GSE..... _RAW.tar をクリックすれば、全サンプルの生データをダウンロードできます。
各々のサンプルのファイルは、Affymetrix Probe Results File(.CEL形式ファイル)になっているので、multi-aff-pyなどのソフトウェアが必要です。
Series Matrix File(s)で.txtファイルをダウンロードすれば、データをまとめてcsvテキスト形式でダウンロードできます。
そのままでは .txt ファイルなので、.csvと変換すれば、Excel 2008などの表計算ソフトで解析できます。
この記事が気に入ったらサポートをしてみませんか?