見出し画像

「しましょのNGS解析」始めました。

今年になってから趣味でNGS解析を始めています。

NGS解析 is 何?

NGSとはnext generation sequencerのことで、日本語では次世代シーケンサーです。とにかく簡単に言うと、遺伝子を調べる装置です。

もうちょっと正確に書くと、DNAの塩基配列(A, T, G, Cのやつ)を読み取るもの。「次世代ということは旧世代もあるのか?」という疑問は幾度となく聞かれることですが、「2005年以前にあった装置と違う原理を使う、すごく読み取りスピードが速いやつ」といったところです。

NGSを使えば遺伝子が全部わかる、というわけではありません。わかるのは塩基配列だけで、どこがどうなっているかというのは人間が調べる必要があります。

ところが、NGSから得られるデータはテキストファイルにして数GB〜数十GB。「メモ帳」などのアプリで開くこともできますが、多分数億行になります。見たいところを見つけて調べるためには、コードを組んでデータ処理する必要があります。その処理を総称して「NGS解析」と言います。

なんで一介のライターがNGS解析をやるの?

Twitterでフォローしている人や実際にお会いする人でNGS解析をしている研究者(「バイオインフォマティシャン」と呼ばれている)が多くて、話にちょっとだけ混ざりたいなあ、という出来心です。

あとは、がんゲノム医療とか腸内フローラとか、僕が書く記事でよくNGS解析が出てくるので、実際どんなものだろうという興味があるのは事実です。

どうやってNGS解析をやるのか?

アプリを作ったこともない僕がいきなりNGS解析に挑むのは無謀。ということで研究者向けのテキストを使います。

僕のMacのスペックは次のとおりです。

Mac mini(2018)
CPU: 3.6GHzクアッドコアIntel Core i3
メモリ: 16GB

RNA-Seq(STAR)以外はなんとかいけるはず。今日までは準備編ということでいろいろインストールしたり設定したりしていました。

次から本格的に解析スタートです。noteには週1くらいでレポートを書いていくのでお楽しみに。

* * *

noteユーザーでなくてもハートマーク(スキ)を押すことができます。応援よろしくお願いいたします。

ここまで読んでいただきありがとうございました。サイエンスの話題をこれからも提供していきます。いただいたサポートは、よりよい記事を書くために欠かせないオヤツに使わせていただきます🍰