見出し画像

RNA-seq解析をウェブブラウザ上でできる!〜iDEPを使ってみた

こんにちは。NGS解析をしたいと思い立ってR言語を勉強し始めた生命科学系研究者のえいこです。生命科学分野の便利ツールが紹介されている「統合TV」のサイトを見ていたら、RNA-seqの解析をウェブブラウザ上で解析できるiDEPの紹介動画がありました。

NGS解析に関する知識はまだまだで勉強途中で、実践に使えるのはまだまだ先。ウェブブラウザ上で動くんだったらすぐに使えて、便利なのでは?と思ったので、どんなものか試しに使ってみました。

参考にした統合TVの動画はこちら。

iDEPでどんなことができるのかまとめていきます。

----------

◇ iDEPはデータがあればすぐに解析できる!

iDEPはウェブブラウザ上でRNA-seqデータ解析が簡単にできるツールです。バックで動いているのはR。Rの可能性を感じられるサイトになっています。まずは、iDEPのサイトにアクセスしてみましょう。

シンプルでわかりやすいインターフェイス。アップロードできるデータは、カウントデータ、p値・FDR値が入ったデータ、サンプルデータ、実験条件データなどです。データのフォーマットの詳細については、こちらをご覧ください。

今回はiDEPのサイトで用意されているデモデータを使って、どんなことができるのか見ていきたいと思います。サイトの左上の"Click here to load demo data"をクリックすると右側の画面にデータセットが表示されます。

画像1

上側のカラムには各実験の条件やサンプルについての情報が、下側のカラムには遺伝子名とカウント情報が載っています。

次に、簡単にデータの概要を見てみましょう。一番上のツールバーの"Pre Process"をクリックしましょう。

画像2

画像3

各サンプルの全カウント数や、2サンプル間の発現の違いを見るためのScatterグラフを描いてくれます。ScatterグラフのX軸とY軸はピンクの〇で囲ったところで変えられます。

また、個々の遺伝子発現の違いを見るためには左側のメニューバーの"Plot one or more genes"(ピンクの〇)をクリックして、オレンジの〇の部分に遺伝子IDを入れると見ることができます。

画像4

これで着目している遺伝子がどう動いているかを見ることができますね。

さて、"Pre Process"でデータの概要を見てきました。次はiDEPでどんな解析ができるのか、ざっと見ていきましょう。

◇ iDEPでできる解析

iDEPは上のツールバーをクリックすることで、解析が一発でできます。

できる解析は、

Heatmap作成
・k-Means
PC解析
DEG(変動遺伝子)
Pathway解析
Genome
Bicluster
... etc.

とまぁ、論文を書くために必要な解析はカバーしているのではないかと思います。太文字で描いた解析について、どんな感じで解析されるのか見てみましょう。

・Heatmap作成

画像5

ツールバーの"Heatmap"をクリックすると自動的にHeatmapを作ってくれます。微調整などは左側のメニューバーからできます。

・PC解析

画像6

論文でよく見る主要成分解析(PC解析)も簡単にできます。

・DEG(変動遺伝子)

画像7

ツールバーの"DEG1"をクリックすると発現上昇した遺伝子と発現低下した遺伝子の数を表示してくれます。"DEG2"との違いはまだよくわかりません。

・Pathway解析

画像8

変動した遺伝子で濃縮できるPathwayを多い順に表示してくれます。デフォルトはGo pathway解析になっています。

また、抽出されたPathwayの関係性も、

画像10

・Genome

画像9

ゲノム上のどこに、変動遺伝子が集積しているのかビジュアル化もできます。

Bicluster

画像11

画像12

クラスターごとの遺伝子の一覧や、濃縮されているPathwayも見ることができます。


と、ボタン一つでこれだけのことができるようになるんだったらもうRの勉強しなくても良いのでは?とも思っています…RNA-seqの解析に関してはまだまだ分からないことが多いので勉強するつもりですが。ちなみに、iDEPでのRのコードは全て公開されています。

最後に…

これだけ便利なツールを作って維持するのはかなり大変。解析に使ったときは必ず下記の論文を引用しましょう!

Ge SX, Son EW, Yao R: iDEP: an integrated web application for differential expression and pathway analysis of RNA-Seq data. BMC Bioinformatics 2018, 19(1):534. PMID:30567491


それでは、また!

最後までお読みいただきありがとうございます。よろしければ「スキ」していただけると嬉しいです。 いただいたサポートはNGS解析をするための個人用Macを買うのに使いたいと思います。これからもRの勉強過程やワーママ研究者目線のリアルな現実を発信していきます。