見出し画像

ゲノム編集を可能にするツールの基礎

今回は、また宮岡祐一郎先生の「トコトンやさしいゲノム編集の本」から、ゲノム編集を可能にするツールについて、初学者なりにまとめていきます。
いろんな分野で利用されている技術であるからこその怖い面も多いと感じます。

1:ヌクレアーゼってなに?
前回までのまとめでは、切断されたDNAを修復する仕組みには、NHEJ、HR、MMEJなどのいくつかの種類があることを知りました。
このDNAの修復機能を利用してゲノムを編集するには、標的とする配列のDNAを切断しなければなりません。
DNAを数珠に例えると、玉の一つ一つはデオキシリボヌクレオチドです。
DNAの切断は、このデオキシリボヌクレオチドの間の結合を切り離す化学反応です。
実は生物はこの反応を起こすヌクレアーゼと呼ばれる酵素を持っています。

ヌクレアーゼには、DNAだけ、RNAだけ、あるいはその両方を切断するものなど、様々な種類があります。
また、どんな塩基配列のDNAでも構わず切断するものと、決まった配列のDNAだけを切断するものがあります。
後者の中でも有名なものに、制限酵素と呼ばれる一群の酵素があります。
制限酵素はもともと細菌で見つかり、細菌に感染するウイルスのDNAを切断し排除する細菌の免疫の仕組みの一つです。
制限酵素は、ある特定の塩基配列だけに結合してDNAを切断します。

例えば、EcoRIと呼ばれる制限酵素は、GAATTCという順番の6個のDNA塩基配列の並びを見つけ出し、切断します。

制限酵素のイメージ

制限酵素には様々な種類があり、それぞれが独自の標的とする塩基配列を持っています。この制限酵素の発見により、DNAを切り貼りして、遺伝子の単離や人工的な融合を行えるようになりました。

このようにDNAヌクレアーゼは、デオキシリボヌクレオチド同士の結合を切り離す役割を果たしており、ゲノム編集に用いられる技術もその一種です。
後述するゲノム編集に革命をもたらしたCRISPR/Casシステムも、制限酵素と同じように、細菌の免疫の仕組みから発見されたものでした。

2:長い標的配列のDNAを切る〜メガヌクレアーゼ:
制限酵素の標的DNAの配列は数塩基です。
例えば、EcoRIは、GAATTCという配列が標的です。
塩基には4種類があるので、6個の塩基の並び方は、4の6乗で、4096通りあります。ということは、仮に塩基がランダムに並んだ場合、大体4000塩基に1箇所の確率でGAATTCという配列が生じることになります。
ヒトのゲノムDNAは約60億塩基ですから、EcoRIで切断出来たとすると、約150万個のバラバラの破片になってしまいます。
つまり、ゲノム編集のためには、ヌクレアーゼの標的DNA塩基配列はある程度長くなければなりません。

そこで、メガヌクレアーゼと呼ばれる一群の酵素が注目されました。

メガヌクレアーゼが認識する配列は、12〜40塩基ほどです。

例えば、I-SceI は、TAGGGATAACAGGGTAATという18塩基の標的配列を持ちます。計算上、ランダムにこの配列が生じるのは、約690億塩基に1箇所で、実際ヒトやマウスのゲノムDNAには存在しません。
そこで1990年代に、マウスの細胞のゲノムDNAにこの18塩基の標的配列を人工的に組み込み、細胞の中でI-SceI によって切断する実験が行われました。
その結果、初めてゲノムDNAの狙った箇所を切断すると、NHEJやHRといったDNA修復機構が働き、切断部位の塩基配列を改変出来ることが明らかになりました。

メガヌクレアーゼ ISceI によるDNA切断のイメージ

この実験は、ゲノムDNAの標的とする部位を切断し、細胞の持つDNA修復機構を介してゲノムを編集するという、ゲノム編集の基本的な概念を確立した、非常に重要なものでした。
しかしながら、メガヌクレアーゼは認識する塩基配列が決まっており、その配列を変更するのが非常に困難です。これでは、編集したい部位を自由に選ぶことが出来ません。更なる技術の発展が待たれていました。

3:人工制限酵素の始まり〜ジンクフィンガーヌクレアーゼ(ZFN)
標的とするDNA塩基配列を自由に選択し、切断するための最初の人工制限酵素、
ジンクフィンガーヌクレアーゼ(Zinc Finger Nuclease,ZFN)は、1990年代後半に開発され、2000年代半ばに初めてヒトの細胞でゲノム編集に用いられました。
ZFNは、DNAの塩基配列を認識するDNA結合部位とDNAを切断するヌクレアーゼ部位からなります。

ZFNのDNA結合部位は、約30個のアミノ酸からなる、ジンクフィンガーと呼ばれる構造の繰り返しで出来ています。
ジンクフィンガーは、1個あたり3個のDNAの塩基対をまとめて認識するという特徴を持っており、もともとはDNAに結合して働く別のタンパク質の一部です。
ジンクフィンガーにはアミノ酸配列が少しずつ異なるたくさんの種類があり、それぞれが異なる3個の塩基対を認識します。
例えば、CAG、TAG、CGA、AAGをそれぞれ認識するジンクフィンガー4個を繋げることにより、CAGTAGCGAAAGという12塩基を認識するDNA結合部位を作ることが出来ます。
したがって、標的配列に合わせてジンクフィンガーを選択・連結することで、
「狙ったDNA塩基配列を認識する」ことが出来るようになりました。

さらにこのDNA結合部位を、FokIという制限酵素のDNAを切断する部位を融合したものがZFNです。
FokIは一つの分子ではDNAを切断出来ず、二つの分子が集まった時に初めてDNAを切断するという特徴を持っています。
したがって、標的とするゲノムDNA配列の両側にZFNを設計し、2分子のFokIがゲノムDNAの標的箇所に正しく集合した時にだけDNAを切断するように工夫されています。
これは、DNA切断に必要な認識塩基配列を十分に長くすることによって、ゲノムDNA中の標的とは関係のない部分を切断してしまうのを防ぐためです。
DNAの標的部位を切断した後は、NHEJ、HR、MMEJ などでゲノムが編集されます。

ZFNとFokIのイメージ

4:植物の病原細菌からの発見〜タレン
初めて自在なゲノム編集を可能にしたZFNは画期的な発明でした。
しかし、いくつかの問題点も抱えていました。
まず、どの種類のジンクフィンガーがDNAのどの3塩基対を認識するかのルールが明確でなく、ZFNの設計が必ずしも簡単でないことがありました。
特許などの知的財産権も厳しく管理され、研究目的であっても自由に使えないということもあったようです。
そうした状況の中、次なる発見は植物に感染する病原細菌から見つかりました。
この細菌の持つたんぱく質をよく調べてみると、タルリピートと呼ばれる、34個のアミノ酸が並んだ構造を繰り返して持っており、実はタルリピート1個がDNAの塩基対1個を認識することが明らかになりました。
しかも、ジンクフィンガーのように、タルリピートにもいくつかの種類が存在し、A、T、G、Cのいずれかを認識して結合するのです。
ジンクフィンガーは、1個で3個の塩基対を認識しますが、タルリピートと塩基は1対1の関係です。
したがって、標的DNAの塩基配列の順番通りに、対応するタルリピートを並べれば、標的塩基配列を認識するDNA結合部位が完成します。
あとは、ZFNと同様に、タルリピートの繰り返しからなるDNA結合部位を、FokIのDNA切断部位と融合させれば、
タレン(Transcription Activator-like effector nuclease;TALEN)
の完成です。
植物に感染する細菌から見つかった、タルリピートを持つたんぱく質の名前からTALENと名づけられました。
タレンは、タルリピートとDNAの塩基との対応が1対1で理解しやすく、研究目的であれば誰でも自由に使うことが出来ました。

TALENのイメージ

しかし、タレンがゲノム編集技術の完成形かと思われたのもほんの一瞬でした。
CRISPR/Casシステムによって、ゲノム編集技術は更なる飛躍を遂げることになるのです。

5:CRISPR/Casの衝撃〜ゲノム編集を広めた立役者
TALEN研究が広がりつつあった2012年、ダウドナ博士とシャルパンティエ博士らは、CRISPR/Casを利用して、初めて自分の狙ったDNAを切断出来ることを示しました。そしてその直後の2013年に、ジャン博士らが初めてCRISPR/Casを利用してヒトの細胞のゲノムDNAを編集しました。
CRISPR/Casが何であるか。
それは、細菌などが持つウイルスに対する免疫の仕組みの一つです。

細菌がウイルスに感染した時には、そのDNAを切断することで、ウイルスの増殖を防ぐのです。
制限酵素も免疫の仕組みの一つですが、例えば、GAATTCという配列を認識して切断するEcoRIのように、あらかじめ切断する標的が決まっています。
CRISPR/Casシステムも、標的とするウイルスのDNAを切断しますが、その標的配列を状況に応じて変えることが出来ます。
これは、CRISPR/Casシステムが、細菌が一度感染したウイルスのDNA配列を記憶して、同じウイルスの二度目の感染を防ぐ仕組みだからです。
ヒトの場合も、水疱瘡などに一度かかると、免疫システムが病原体の特徴を記憶して、二度目の感染を防ぐのとちょうど同じ役割です。
この特徴をゲノム編集技術として利用するのです。
すなわち、本来ウイルスDNAを切断するためのCRISPR/Casシステムを改変し、編集を行いたいゲノムDNAの標的配列を切断するのです。
切断の後は、NHEJ、HR、MMEJなどの、細胞がもともと持つDNA修復機構を介してゲノムの編集を行うことが出来ます。

CRISPR/Casのイメージ

6:実は日本の科学者が最初に発見していた
CRISPRは、clustered regularly interspaced short palindromic repeat の略。
直訳すると、「一定の間隔を置いて配置された短い回文反復」です。
回文は、「しんぶんし」のように、反対から読んでも同じになる言葉、ないし、文です。

DNAは二重らせんで、AとT、GとCが対をなすため、GAATTCなどの配列が回文です。(GAATTCと対のDNA鎖を反対から読んでみてください。)
GAATTCは制限酵素EcoRI の認識配列であるように、実は、回文のDNAは特殊な機能を持つことが多いのです。

CRISPRの歴史は、1987年に石野良純教授が大腸菌のゲノムDNAの中に、29塩基のほとんど同じ塩基配列が、32塩基の一見ランダムな塩基配列を挟んで5個も並んでいることを発見したことから始まります。
しかも、29塩基の繰り返される塩基配列は、
TCCCCGC(4塩基の間隔)GCGGGGA という回文構造まで持っていたのです。

石野博士は、全く別の目的で大腸菌のDNAの塩基配列を解読していたのですが、特徴的なこの塩基配列を見逃さずに報告しました。
しかし、当時はこの配列にどのような意味があるのか、誰も予測出来ませんでした。

1990年代に入ると、DNA配列を解読する技術が発展し、大腸菌で見つかったCRISPRと同じ同じ特徴を持つ塩基配列を、他の細菌も持つことが明らかになってきました。
同時に、CRISPRの塩基配列の近くには、必ずある遺伝子(つまりたんぱく質のアミノ酸配列を決定するDNAの塩基配列)が存在することも示されました。
これらの遺伝子は、CRISPRに付随する、という意味で、
Cas(CRISPR-associated)と名づけられ、CRISPRとCasを合わせたシステムを
CRISPR/Casと呼ぶようになりました。

CRISPR(リピート配列とスペーサー配列)とCasのイメージ

しかし、Casの果たす役割も、最初は全く不明でした。

7:洗練された免疫機構〜RNA配列で標的DNA配列を決定
1990年代後半から2000年代にかけ、ウイルスを含む多様な生物種のDNAの塩基配列が次々と明らかになりました。
その結果、石野博士が最初に見つけた規則的な塩基配列の間に挟まれていた、一見ランダムな32塩基のスペーサー配列の由来を探せるようになりました。
その結果、2005年には、スペーサー配列が、細菌に感染するウイルスDNAの一部であることが明らかになりました。

なぜ、ウイルスDNAが、その感染相手である細菌のゲノムDNAの中に組み込まれているのか?
もしかしたら、CRISPR/Casは、このウイルス由来配列を利用した免疫機構かもしれない、という推測が初めてなされたのです。

CRISPR/Casが実際に免疫機構として働くという実験的な証拠は、とある食品会社の研究が示しました。
ヨーグルトやチーズの作製には、乳酸菌などの力が欠かせないため、菌と食品は密接に関わっています。
この研究で、細菌があるウイルスに感染すると、そのウイルスのDNAの一部が細菌のCRISPR配列に取り込まれること、取り込まれたウイルスDNAの配列を人工的に取り替えると、それに対応して、細菌が免疫を発揮するウイルスの種類も変わることが示されました。

引き続く研究により、CRISPR配列はRNAに転写されることが示されました。
(伝令RNA;mRNA と異なり、翻訳されずにRNAのまま機能します。)
このCRISPR配列から転写される、ウイルスDNAに対応する配列を持つRNAを
crRNA(CRISPR RNA)と呼びます。
さらに、crRNAは、標的のウイルスDNAと塩基対を形成し、そこにCasたんぱく質を誘導することで、標的配列を持つDNAを切断することが解明されました。
Casたんぱく質はヌクレアーゼだったのです。
crRNAによって、Casたんぱく質を標的配列に誘導してDNAを切断する、
CRISPR/Casシステムの働きが明らかになってきたのです。

ウイルスDNAのCRISPR配列への取り込みと、その配列を使ったウイルスへの免疫のイメージ

8:謎のDNA配列から世界を変える技術に(免疫機構からゲノム編集ツールへ)
CRISPR/Casにはいくつかの種類がありますが、ここでは、最も研究が進んでいる化膿性連鎖球菌のCRISPR/Cas9を例にして説明します。
CRISPR配列から転写されるcrRNAが、標的DNA配列にCas9を誘導するためには、tracrRNA(trans-activating crRNA)と呼ばれる、もう一つのRNAが必要であることが明らかとなりました。
tracrRNAは、どの標的遺伝子でも全く同じ配列で機能し、crRNAとCas9たんぱく質と共に集合します。
この集合体は、まず標的DNAの目印であるPAM(protospacer adjacent motif)
と呼ばれる塩基配列を探します。

化膿性連鎖球菌のCas9の場合は「NGG」という配列です。(Nは、4種類の塩基の何でもいいです。)
実は、細菌はウイルスのDNAの中から、必ずPAMのすぐ近くの配列をCRISPR配列に組み込みます。
そのため、標的DNAの切断には、まずこの目印のPAMを探すのです。
ウイルスDNAと混同して、自分のゲノムDNAも切断してしまわないよう、PAMはCRISPR配列そのものには存在しません。PAMは非自己の標的配列の目印なのです。
Cas9とcrRNA、tracrRNAの集合体は、PAM配列を見つけると、PAMの隣のDNA配列とcrRNAが20塩基にわたり正しく塩基対を形成するかと確認し、形成出来たときにのみ、Cas9がDNAを切断します。crRNAの端の20塩基と、DNAとの塩基対の形成能力で、CRISPR/Cas9の標的配列であるかの判断が下されます。
2012年にダウドナ博士、シャルパンティエ博士らは、CRISPR/Cas9のDNA切断の仕組みを明らかにし、crRNAとtracrRNAをガイドRNAと呼ばれる分子に融合しました。
更に、このガイドRNAを任意の配列に変え、狙ったDNAの切断にも成功しました。
CRISPR/Cas9を、ゲノム編集技術に変換した、歴史に残る研究成果でした。

CRISPR/Cas9の原理

9:ゲノム編集ツールの最終形態?
2012年にCRISPR/Cas9によるDNA切断の仕組みが報告されてから、わずか数ヶ月後の2013年初めには、ジャン博士らによって、CRISPR/Cas9によるヒトの細胞のゲノム編集が報告されました。
ここからゲノム編集の研究は飛躍の時を迎えます。

ゲノム編集ツールは「DNAの標的配列を認識し」「そのDNAを切断する」というこの働きが必要です。
DNAを切断するという働きに関しては、どのゲノム編集ツールであっても、大きな違いはありません。
一方で、標的配列を認識する仕組みには、CRISPR/Cas9システムと、ZFNやTALENなどとの間に決定的な違いがあります。

ZFNやTALENは、標的DNAの塩基の認識をジンクフィンガー、あるいはタルリピートによって、たんぱく質として行います。したがって、標的配列を変更するたびに、ジンクフィンガーやタルリピートを並び替えた別のたんぱく質を用意しなくてはいけません。これはかなりの手間と時間を要します。

一方で、CRISPR/Cas9の標的配列の認識は、標的DNAとの塩基対形成によって、ガイドRNAが行います。そのため、標的配列の決定の仕組みが非常に単純な上、ヌクレアーゼであるCas9は、どの標的配列にも使うことが出来ます。
現代の技術であれば、20塩基程度のDNAは、一晩のうちに機械で自動的に合成することが出来ます。
したがって、標的配列を決定する部分だけの20塩基程度のDNAを購入し、ガイドRNAとして転写すれば、非常に簡単かつ安価に標的DNA配列を決定することが出来ます。しかも、Cas9は全ての標的配列に共通して機能しますので、多種類のガイドRNAとCas9を同時に細胞に提供することで、ゲノムDNA中の多数の標的を同時に編集することも可能になりました。

ZFNとTALENとCRISPR/Cas9の違い

CRISPR/Cas9によるゲノム編集が発表された当初、最大の懸念はその正確性でした。ZFNやTALENが1組で少なくとも25から30塩基を認識するのに対し、CRISPR/Cas9が標的配列の認識に使うガイドRNAは20塩基しか認識しないからです。実際に、初期のCas9によるゲノム編集では、標的配列以外のDNAに傷をつけてしまう問題も報告されていました。しかし、現在は様々な改良がなされ、CRISPR/Cas9の正確性も格段に高まってきています。
CRISPR/Cas9が現在抱える問題の一つは、その知的財産権を巡って大規模な特許紛争が起きていることもあります。
そうは言っても、CRISPR/Cas9による医療や産業目的の研究は現在も活発に進んでいます。

次回からは、ゲノム編集技術の先端技術について、初学者の年寄りなりにまたまとめていけたらと思っています。

この記事が気に入ったらサポートをしてみませんか?