遺伝子を探す

 大学の研究室に限らず、これまで何をしていたかというと、植物を材料にして色々な遺伝子を探していることが多かったです。ヒトでは2万3千個の遺伝子、コムギでは12万4千個(!)の遺伝子があり、その一つ一つが何らかの機能を持っています。ある現象に関わる遺伝子を明らかにすることで、どうしてその現象が起こっているのか分かったり、好ましい遺伝子を持っている個体を選抜して、新しい品種にしたり、あるいはその遺伝子の多様性を調べて、強いものや弱いものをみつけたり。

遺伝子のデータベース

アメリカ国立衛生研究所(NIH)はGenBankというデータベースを管理しています。データベースに保管されている遺伝子のDNA配列(と翻訳されたアミノ酸配列)は、指数関数的に増加しており、1982年に設立されて以来、およそ20年(2003年)で29,819,397個の配列、35,599,621,471塩基のDNA配列が保管されるに至りましたが、更にその20年後の2023年10月には、3,854,974,017 個の配列、26,744,384,364,323塩基のDNA配列、DNA配列の数は130倍、データは750倍に増えています。

遺伝子の探し方

このGenBankを使って遺伝子を探すことになります。20年以上前はモデル生物といって、ヒト、マウス、アフリカツメガエル、センチュウといった生物種の情報が主で、植物ではシロイヌナズナというアブラナ科の植物の情報が豊富でした。それ以外の植物はというと、EST(Expressed Seuqnce Tag)やBAC (Bacterial Artificial Chromosome)というDNA配列が存在していて、これらの情報を頼りに目的の遺伝子に近づこうとします。

EST

今では生物の全遺伝情報、ゲノム情報は入手しやすい状況にありますが、当時は莫大なコストがかかる国家プロジェクトレベルの研究であり、そうそう手が出せるものではありませんでした。それでも効率よく遺伝子の研究をするためには、機能している遺伝子、つまり発現している遺伝子、mRNAの配列を調べるのが良いということになります。個々の遺伝子の発現は時間、場所、環境や他の遺伝子の影響を受ける、極めて複雑なものです。が、例えば開花している時の遺伝子であれば、咲いている花からmRNAを取り出して全部調べれば、その遺伝子が見つかる可能性は高いといえます。ということで、少し技術的な説明になりますが、研究したい現象が起こっている部分からmRNAを抽出して、cDNA (Complementary DNA)に逆転写して、片っ端からDNA配列を解読していきます。この配列がESTです。ESTは、その時その場所で発現している遺伝子の配列、といえますね。

BAC

ヒトゲノムは、46本の染色体というDNAとタンパク質の複合体で構成されています。染色体は2本1組(父母から1本ずつ受け継ぐ)なので23対となります。例えば、ヒト1番染色体は2億5千万ほどのDNA配列です。一方、当時の技術的に一度に解読できるDNA配列は1千ほどで、全てのゲノム配列を解読するのは気の遠くなるような時間がかかります。このため、ゲノムDNAを細かく切断し、大腸菌の中に入れて増殖できるようにしました。これがBACと言われ、酵母で増殖した場合はYAC(Yeast Artificial Chromosome)となります。BACを作成したことで、色々な研究機関で並行してゲノム配列の解読を進めることができるようになりました。解読を進めながらパズルのピースを埋めるように大量のBACのDNA配列を繋いでいき、それが出来上がったのが当時のゲノム配列でした。

結構書いてしまいましたが、遺伝子の探し方まで行かなかったですね…また次回に。

この記事が気に入ったらサポートをしてみませんか?