Qiime2を使った微生物叢の解析(その1)
1. manifestとmetadataファイルを準備します。
シーケンスしたサンプルに関する情報について、manifestファイルとmetadataファイルを作成します。
manifestファイルの例:20180220_Kazusa-manifest.txt
fastq.gzファイルのforward、reverseは、$PWD/...L001_R1_001.fastq.gz、および$PWD/...L001_R2_001.fastq.gzファイルを例としてひとつずつ解凍して開き、最初の配列を確認。
NexteraXT Indexで調整したライブラリーをMiSeqでrunした際のforward、reverseは以下の通り。
forward primer 5’-CCTACGGGNGGCWGCAG-3’
reverse primer 5’-GACTACHVGGGTATCTAATCC-3’
metadataファイルの例:20180220_Kazusa-metadata.tsv
manifest.txtファイルは、(,)区切りでスペースは入れません。
metadata.tsvファイルは、タブ区切りで作成します。
それぞれExcelで作成してcsv形式、tsv形式で保存して作成すると楽です。
metadataは qiime2018.2以降、一行目のカラム名にIDなどの文字列を受け付けなくなったので、エラーが出た場合には別のカラム名を用いるか、#IDなど、[#]を文字列の前に付けます。また、空白スペースなども受け付けません。
後にエラーが出るのは、metadata.tsvファイルの文字列に問題があるケースがほとんどですので、エラーが出た場合には文字列をチェックして書き換えましょう。
2. Qiime2の起動とQualityのチェック
ワーキングディレクトリーへ移動して起動します。
例えば、fastaファイルがユーザーshigeruの20180212フォルダに入っている場合。
iMac: ~shigeru$ cd 20180212
インストールされているqiime2のバージョンに合わせてqiime2を起動。
ここでは、qiime2-2018.2なので以下のように入力します。
iMac:20180112 shigeru$ source activate qiime2-2018.2
NGSから出力されたfastaファイルを読み込んでシーケンス情報を確認します。
(qiime2-2018.2) nedonoiMac:20180112 shigeru$ qiime tools import --type 'SampleData[PairedEndSequencesWithQuality]' --input-path 20180220_Kazusa-manifest.txt --output-path paired-end-demux-2018220_Kazusa.qza --source-format PairedEndFastqManifestPhred33
* Qiime2-2019.04以降では、--source-formatは、--input-formatになっています。
paired-end-2018220_Kazusa.qzaというファイルが出力されます。
paired-end-2018220_Kazusa.qzaを可視化するためにpaired-end-demux-20180220_Kazusa.qzvに変換します。
(qiime2-2018.2) nedonoiMac:20180112 shigeru$ qiime demux summarize --i-data paired-end-demux-20180220_Kazusa.qza --o-visualization paired-end-demux-20180220_Kazusa.qzv
paired-end-demux-20180220_Kazusa.qzvというファイルができます。
paired-end-demux-20180220_Kazusa.qzvをブラウザで表示します。
(qiime2-2018.2) nedonoiMac:20180112 shigeru$ qiime tools view paired-end-demux-20180220_Kazusa.qzv
paired-end-demux-20180220_Kazusa.qzvをブラウザで表示すると、各サンプルのRead数等が表示されます。Interactive Quality Plotのメニューを開いて、シーケンスのQualityとMedian Qualityの長さをチェックします。
(この情報をもとに配列をトリムします)
Qiime2のターミナルに戻るときは、
*Qiime2の解析結果はアーティファクトファイル.qzaとして保存されます。
可視化するためには、.qzvファイルに変換して、qiime tools viewコマンドで表示します。
続く。