![見出し画像](https://assets.st-note.com/production/uploads/images/17817000/rectangle_large_type_2_002a49d375bd439249274da08faece12.jpeg?width=800)
「しましょのNGS解析」始めました。
今年になってから趣味でNGS解析を始めています。
NGS解析 is 何?
NGSとはnext generation sequencerのことで、日本語では次世代シーケンサーです。とにかく簡単に言うと、遺伝子を調べる装置です。
もうちょっと正確に書くと、DNAの塩基配列(A, T, G, Cのやつ)を読み取るもの。「次世代ということは旧世代もあるのか?」という疑問は幾度となく聞かれることですが、「2005年以前にあった装置と違う原理を使う、すごく読み取りスピードが速いやつ」といったところです。
NGSを使えば遺伝子が全部わかる、というわけではありません。わかるのは塩基配列だけで、どこがどうなっているかというのは人間が調べる必要があります。
ところが、NGSから得られるデータはテキストファイルにして数GB〜数十GB。「メモ帳」などのアプリで開くこともできますが、多分数億行になります。見たいところを見つけて調べるためには、コードを組んでデータ処理する必要があります。その処理を総称して「NGS解析」と言います。
なんで一介のライターがNGS解析をやるの?
Twitterでフォローしている人や実際にお会いする人でNGS解析をしている研究者(「バイオインフォマティシャン」と呼ばれている)が多くて、話にちょっとだけ混ざりたいなあ、という出来心です。
あとは、がんゲノム医療とか腸内フローラとか、僕が書く記事でよくNGS解析が出てくるので、実際どんなものだろうという興味があるのは事実です。
どうやってNGS解析をやるのか?
アプリを作ったこともない僕がいきなりNGS解析に挑むのは無謀。ということで研究者向けのテキストを使います。
僕のMacのスペックは次のとおりです。
Mac mini(2018)
CPU: 3.6GHzクアッドコアIntel Core i3
メモリ: 16GB
RNA-Seq(STAR)以外はなんとかいけるはず。今日までは準備編ということでいろいろインストールしたり設定したりしていました。
#しましょのNGS解析
— しましょ(島田祥輔) (@shimasho) January 7, 2020
しましょはターミナル画面を バイオインフォマティシャンが好む古風な表示にした!
デフォルトシェルをbashに設定した!
RefGeneヒト遺伝子データの先頭100行をダウンロードした! #NGS_DAT pic.twitter.com/KwHsZBtthw
#しましょのNGS解析
— しましょ(島田祥輔) (@shimasho) January 8, 2020
しましょはRをインストールした!
Homebrewをインストールした!
Biocondaをインストールした!(Biocondaは前回なかった気がする)#NGS_DAT pic.twitter.com/opa7aCJehR
#しましょのNGS解析
— しましょ(島田祥輔) (@shimasho) January 9, 2020
しましょはGitHubのアカウントを作った!
レポジトリを作ってソースコードをアップした!#NGS_DAT pic.twitter.com/TbH5DdRlBd
次から本格的に解析スタートです。noteには週1くらいでレポートを書いていくのでお楽しみに。
* * *
noteユーザーでなくてもハートマーク(スキ)を押すことができます。応援よろしくお願いいたします。
ここまで読んでいただきありがとうございました。サイエンスの話題をこれからも提供していきます。いただいたサポートは、よりよい記事を書くために欠かせないオヤツに使わせていただきます🍰