Qiime2を使った微生物叢の解析(その1)

1. manifestとmetadataファイルを準備します。

シーケンスしたサンプルに関する情報について、manifestファイルとmetadataファイルを作成します。

manifestファイルの例:20180220_Kazusa-manifest.txt

sample-id,absolute-filepath,direction
RS1_S37,$PWD/RS1_S37_L001_R1_001.fastq.gz,forward
RS1_S37,$PWD/RS1_S37_L001_R2_001.fastq.gz,reverse
BR3_S38,$PWD/BR3_S38_L001_R1_001.fastq.gz,forward
BR3_S38,$PWD/BR3_S38_L001_R2_001.fastq.gz,reverse
RL1_S41,$PWD/RL1_S41_L001_R1_001.fastq.gz,forward
RL1_S41,$PWD/RL1_S41_L001_R2_001.fastq.gz,reverse

fastq.gzファイルのforward、reverseは、$PWD/...L001_R1_001.fastq.gz、および$PWD/...L001_R2_001.fastq.gzファイルを例としてひとつずつ解凍して開き、最初の配列を確認。
NexteraXT Indexで調整したライブラリーをMiSeqでrunした際のforward、reverseは以下の通り。
forward primer 5’-CCTACGGGNGGCWGCAG-3’
reverse primer 5’-GACTACHVGGGTATCTAATCC-3’

metadataファイルの例:20180220_Kazusa-metadata.tsv

#SampleID SoilSource PlantType Treatment Group Description
RS1_S37 Vermiculite stems Red RS1 RS
BR3_S38 Vermiculite roots Blue BR3 BR
RL1_S41 Vermiculite leaves Red RL1 RL

manifest.txtファイルは、(,)区切りでスペースは入れません。
metadata.tsvファイルは、タブ区切りで作成します。

それぞれExcelで作成してcsv形式、tsv形式で保存して作成すると楽です。
metadataは qiime2018.2以降、一行目のカラム名にIDなどの文字列を受け付けなくなったので、エラーが出た場合には別のカラム名を用いるか、#IDなど、[#]を文字列の前に付けます。また、空白スペースなども受け付けません。
後にエラーが出るのは、metadata.tsvファイルの文字列に問題があるケースがほとんどですので、エラーが出た場合には文字列をチェックして書き換えましょう。


2. Qiime2の起動とQualityのチェック

ワーキングディレクトリーへ移動して起動します。
例えば、fastaファイルがユーザーshigeruの20180212フォルダに入っている場合。

iMac: ~shigeru$ cd 20180212

インストールされているqiime2のバージョンに合わせてqiime2を起動。
ここでは、qiime2-2018.2なので以下のように入力します。

iMac:20180112 shigeru$ source activate qiime2-2018.2

NGSから出力されたfastaファイルを読み込んでシーケンス情報を確認します。

(qiime2-2018.2) nedonoiMac:20180112 shigeru$ qiime tools import --type 'SampleData[PairedEndSequencesWithQuality]' --input-path 20180220_Kazusa-manifest.txt --output-path paired-end-demux-2018220_Kazusa.qza --source-format PairedEndFastqManifestPhred33

* Qiime2-2019.04以降では、--source-formatは、--input-formatになっています。

paired-end-2018220_Kazusa.qzaというファイルが出力されます。

paired-end-2018220_Kazusa.qzaを可視化するためにpaired-end-demux-20180220_Kazusa.qzvに変換します。

(qiime2-2018.2) nedonoiMac:20180112 shigeru$ qiime demux summarize --i-data paired-end-demux-20180220_Kazusa.qza --o-visualization paired-end-demux-20180220_Kazusa.qzv

paired-end-demux-20180220_Kazusa.qzvというファイルができます。

paired-end-demux-20180220_Kazusa.qzvをブラウザで表示します。

(qiime2-2018.2) nedonoiMac:20180112 shigeru$ qiime tools view paired-end-demux-20180220_Kazusa.qzv

paired-end-demux-20180220_Kazusa.qzvをブラウザで表示すると、各サンプルのRead数等が表示されます。Interactive Quality Plotのメニューを開いて、シーケンスのQualityとMedian Qualityの長さをチェックします。
(この情報をもとに配列をトリムします)

Qiime2のターミナルに戻るときは、

q, Control-C, Control-Dのどれかをタイプします。

*Qiime2の解析結果はアーティファクトファイル.qzaとして保存されます。
可視化するためには、.qzvファイルに変換して、qiime tools viewコマンドで表示します。

続く。

いいなと思ったら応援しよう!