見出し画像

情報で捉える生物学入門#4 【遺伝子工学】

生物が情報の乗り物であるとすると、生物を研究する研究者は、様々な手法を駆使して生物の情報を知りたい。そのためには、情報を増やしたり、読んだり、書いたりする技術が役立ちそうである。今回は特にDNA情報について、そのような分子生物学におけるツール開発を担う遺伝子工学の分野を紹介する。以前少し異なる視点からの生物学のツールを紹介した記事も参照されたい。


DNAを増やす技術

DNAを試験管内で増やす技術として開発されたのが、1993年にノーベル化学賞を受賞したPCR(ポリメラーゼ連鎖反応)法である。PCR法は、以下の3ステップを繰り返すことで進行する。

  1. DNA2重らせんの変性では、DNAを高温に(約94-98度)に加熱し、2本鎖を1本鎖に解離させる。

  2. プライマーのアニーリングでは、温度を50‐65度まで下げ、あらかじめ複製したいDNA領域の両端に特異的に結合するように設計されたDNA配列(プライマー)が1本鎖に結合する。

  3. DNAの伸長では、温度を約72度に上げ、DNAポリメラーゼのプライマーへの結合、dNTPsが鋳型DNA鎖に相補的に取り込まれることによるプライマーからの新しいDNA鎖の合成を促進する。

上記のステップを20-40サイクル繰り返すことで、DNAコピー数を指数関数的に増加させることができる。一般のタンパク質は最初のステップで高温により変性してしまうが、PCR反応には熱水に生息する細菌からとられた耐熱性のDNAポリメラーゼが用いられていることにより、酵素活性をPCRのサイクルで失活せずに維持できることも重要である。

開発されたのは40年程前だが、試薬の混合と温度の上げ下げだけで桁違いにDNA量を増やすことができるため、いまだに分子生物学の実験で最もよく使われる技術の1つであり、今後DNA合成が革新的な進歩を遂げない限りこの状況は変化しないと思われる。

DNAを読む技術

DNAを手軽に読む技術としてはシークエンシング技術があり、1980年にノーベル化学賞を受賞している。今回は、サンガーシークエンシングで用いられている分子を分離する手法である、電気泳動法について解説する。

電気泳動は分子が電場を受けて移動する現象に基づいている。DNAの場合、DNAは負に帯電しているため電荷をかけると正極に向かって移動する。また、泳動に用いるアガロースゲルが細かい網目状をしているため、サイズが小さいものほど早く移動する。よって、同じ時間泳動した際に、DNA断片のサイズによって異なる位置にDNAがバンド状に集まる。電気泳動が終了したら、ゲルを染色してDNAを可視化する。

サンガ―シークエンシングでは、目的のDNA配列の部分配列を作成し、末端の塩基がA・T・G・Cそれぞれの部分配列の長さを電気泳動で分離・比較することで配列解読を行う。

最近では並列に多数の配列を読む次世代シークエンサーがよく用いられており、ヒトゲノムを10万円以下で読めるようになった。また、個々の細胞のRNAを読むシングルセルシークエンシング技術も様々な生命現象の解明に用いられている重要技術となっている。

DNAを書く技術

DNAを書く技術としては2020年にノーベル化学賞を受賞したCRISPR-Cas9システムがあげられる。CRISPR-Cas9システムは、CRISPR配列とCas9タンパク質から構成される遺伝子編集技術である。CRISPR配列は細菌のDNA中に存在する短い反復配列であり、反復配列の間にウイルスなどの外来由来のDNA断片(スペーサー)が挿入されている。ガイドRNA(gRNA)はCRISPR配列から転写されるRNAで、人工的に設計する際には標的DNAにCas9を誘導できるようそれと相補的な配列を合成する。Cas9タンパク質はDNA2重らせんを切断するエンドヌクレアーゼ酵素で、CRISPR配列から転写されたRNA(ガイドRNA)と結合して複合体を形成する。切断されたDNAは細胞のDNA修復機構によって修復されるが、一般的に非相同末端連結という機構が用いられ、DNAの挿入や欠失による変異が導入される。

CRISPR-Cas9はもともと細菌の獲得免疫のシステムであり、細菌は過去に感染したウイルスの情報をCRISPR配列の間にスペーサーとして挿入することで記憶できる。再び同じウイルスに感染した際に、細菌はCRISPR配列からガイドRNAを生成し、Cas9タンパク質と複合体を形成する。ガイドRNAがウイルスのDNAに結合し、Cas9タンパク質がそのDNAを切断して破壊する。

ゲノム編集といっても実体としてはゲノムを切るだけなので、最初勉強した際には違和感があったが、2019年に発表されたPRIME EditorはATGCどの塩基をどの塩基に変えることも可能であり、本当の意味でのゲノム編集が達成されたともいえる。

DNAコンピューティング

最後に、DNAが単に情報を保持する媒体であるだけでなく、計算処理を行うこともできることを示す例として、DNAで探索アルゴリズムを実装したDNAコンピューティングの研究を紹介する。

計算機科学で有名な問題に、ハミルトニアン経路問題というグラフのすべての頂点を一度ずつ通る経路が存在するか判定する問題が存在する。ハミルトニアン経路問題はNP完全であることが示されており、効率的に解くための一般的なアルゴリズムは存在しない。一方で、この問題を解くためのアルゴリズムとして以下のようなものがある。

  1. グラフ上のランダムな経路を多数生成する。

  2. スタートから始まり、ゴールで終わる経路のみ保持する。

  3. グラフの全頂点数と同じ数だけ頂点を通る経路のみ保持する。

  4. すべての頂点を最低一回通る経路のみ保持する。

  5. 経路が残っているか判定する。

論文では、このアルゴリズムを以下のようにDNAで実装した。

  1. グラフ上のそれぞれの頂点に対応するDNA配列を設計する。グラフの辺を表すDNA配列を始点となる配列の後半と終点となる配列の前半に相補的にすることで、グラフをDNA配列としてエンコードする。その後、これらの頂点を表すDNA配列と辺を表すDNA配列を多数混ぜ合わせる。相補的なDNA塩基配列が塩基対を形成することを利用して、DNA断片を連結するライゲーション反応を行うことで、グラフ上のランダムな経路をエンコードしたDNA分子を作成する。

  2. スタート・ゴールの頂点に対応するDNA配列をプライマーとして用いてPCR反応を行い、ランダムな経路の中でスタートから始まりゴールで終わる経路に対応するDNA配列を選択的に増幅する。

  3. DNA電気泳動を用い、PCRで増幅された配列のうち配列長がすべての頂点の配列長の輪と一致するもののみ切り出し、DNA抽出を行う。

  4. それぞれの頂点と相補的なDNA配列を合成し、それと相補的に結合するDNA部分配列が抽出されたDNA配列に含まれるもののみを保持するという操作をすべての頂点について繰り返す。ここでは、ビオチン-アビジン結合を用いたマグネットビーズ精製システムが用いられており、精製を行うDNA配列をビオチン化し、頂点と相補的なDNA配列をアビジン修飾ビーズに結合させることで、ステップ3で抽出されたDNAと相補的な結合がある場合のみ特異的に分離・精製することができる。

  5. 最後に、生成物がPCR反応で増幅されて電気泳動が行われ、ハミルトニアン経路に対応するDNAが検出されるかがテストされる。

この論文では、DNAの情報保持、相補的な塩基対形成による選択的結合といった基本的な特性の他、探索した結果の選択にPCRが、経路の長さの判定に電気泳動が使われている。また、今回は紹介していないが、それぞれの断片を含むことのチェックに使われているビオチン-アビジン結合もめちゃくちゃ強力な結合として分子生物学の実験で頻繁に用いられる。この研究の筆者は情報科学者であり、情報科学への深い造詣と生命への情報的観点からの視座があったからこそ可能になった研究であろう。DNAコンピューティングは演算速度の観点でもエネルギー消費の観点でもポテンシャルはすごいが、僕の知る限り未だ実用化はされていない未踏の技術で、今後の研究が待たれる。

参考文献

Molecular Computation of Solutions to Combinatorial Problems | Science

生物を情報の観点から研究するためには、DNAの増幅、読み取り、書き換えの技術が重要である。PCR法はDNAを試験管内で増幅する技術で、DNAシークエンシングはDNAの配列を読む技術である。また、CRISPR-Cas9はDNAを編集する技術であり、これらの技術は分子生物学の実験で広く使用されている。

ChatGPTを用いて要約
サムネイル画像はDALL-Eにより生成