遺伝子の文法と、生命の起源
DNAは、4文字だけで20種類のアミノ酸を表す。この表し方を調べていくと、生命の起源についての重大なメッセージが浮かんでくる。
あたまの体操
DNAには、A, T, G, C の4文字しかない。
たんぱく質の材料になるアミノ酸は、メチオニン、ロイシン、グルタミン酸、アルギニン・・・、と20種類ある。
DNAはたんぱく質の設計図で、アミノ酸のならび順が書かれているはずなんだけど、4文字だけでどうやって20種類のアミノ酸を表現しているのだろう?
ここで、あたまの体操だ。
DNAの1文字が、ひとつのアミノ酸を表わすとすると・・・
4文字では、ぜんっぜん足りない。
じゃあ、DNAのとなり合う2文字をひと組みにして、この2文字でひとつのアミノ酸を表わすとすると、どうだろう?
AA, AT, AG, AC, TA, TT・・・と、ぜんぶで何とおり?
16とおりだね。
アミノ酸は、20種類だから・・・
おしい!ちょっと足りない。
じゃあ、3文字でひとつのアミノ酸を表わすと?
AAA, AAT, AAG, ・・・と、書くのがめんどくさいぐらいたくさんの組み合わせになる。
おとなは、こういう時にかけ算を使うのだ。
4×4×4 だから、ぜんぶで64とおり!
これなら20種類のアミノ酸を、よゆうで表現できるね。3文字なら、足りる。
生き物は無駄なことはしない
実際、生き物はこの計算のとおり、DNAの3文字でひとつのアミノ酸を表わしている。
2文字じゃ足りないし、4文字じゃ多すぎる。
3文字は、20種類のアミノ酸をカバーできる、一番少ない文字数だ。だから生き物は「3文字」を採用したと思われる。
生き物は無駄なことはしないのだ。
コドン!
でも、3文字だと64とおりもの組み合わせになって、20種類のアミノ酸をすべて表わしても、まだ44組もあまる。残りの44組は使われないのだろうか?
実は使われている。しかも64組すべて、残らず使われている。
この3文字ひと組みを「コドン」っていう。どのコドンがどのアミノ酸を表わすかは、下の表のようにすべて分かっている。
これがコドン表。美しい。
数学的なまでに美しく、完璧だ。
コドン表を見ていくと、ひとつのアミノ酸をいくつかのコドンが担当しているケースが多いので、64組すべて使われてるんだと分かる。
ただ、TAA, TAG, TGA の3つだけは、なんのアミノ酸も担当していない。からっぽのコドンだ。この3つは「終止コドン」といって、DNA上にこれが出てきたら「たんぱく質はここまで!」っていう、設計図の終わりを意味する記号だ。
あと、メチオニンをあらわす ATG は「開始コドン」でもある。DNA上に ATG が出てきたら、「たんぱく質はここから!」っていう、設計図の始まりを意味している。
遺伝子の文法
これで僕たちは遺伝子の文法を手に入れた。
たとえば、
ATGGCTAAAGACAGC
という遺伝子配列を見ても、もう怖れることはない。
ATG GCT AAA GAC AGC
と、まず3文字ずつ区切る。
それからコドン表と見比べて、
ATG はメチオニン
GCT は アラニン
と、当てはめていく。
すると、この遺伝子配列は、
メチオニン - アラニン - リジン - アスパラギン酸 - セリン
というアミノ酸の配列を書き表していると分かる。
文法が分かれば、遺伝子を読み解けるようになるんだ。
コドン表と生命の起源
地球上のほぼすべての生物が、このコドン表を使っている。まったく同じ文法で、DNAの上にたんぱく質の設計図を書いているんだ。例外もわずかにあるけど、その例外的な生物のコドン表も、上で紹介したコドン表とほんの数か所ちがうだけだ。
つまり大まかには、
「地球上のすべての生物が、おなじコドン表を使っている!」
といっていい。
この「すべての生物」っていうのは、動物や植物はもちろん、キノコなどの菌類や、ゾウリムシなどの原生生物、大腸菌などのバクテリアから、ウイルスまで、本当ににすべてだ。動物っていうのも、ヒトやカブトムシ、ナメクジやミジンコ、ヒトデからイソギンチャクまで、あらゆる動物のことだ。
これがみんな、(基本的には)ひとつのコドン表を使っている。
みんなが、おなじ文法で、遺伝子を書いているんだ。
この強烈な事実は、僕たちにこうささやきかける。
「地球上のすべての生物は、太古に生まれた、たったひとつの細胞の子孫なのだ」と。
想像するだけで、ゾクゾクする。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?