見出し画像

人類の財産?Genbank(ジェンバンク)

研究者は、研究の成果を発表するために論文を書きますが、論文を書く以外にも研究成果であるデータをさまざまな機関に登録しなければなりません。私の場合は自分が発見した単生類(寄生虫)がどのような種なのか決めるために、発見した単生類の塩基配列を調べます。論文を作成すると同時に、この塩基配列情報をGenbankに登録するのですが、この手続きがとても大変です。大学で教鞭をとっている研究者も完璧に登録できないとこぼしていたので、やっぱり難しいのだと思います。今回の投稿は、先日久々に塩基配列を登録したのでどのようなことをしているのか簡単にご紹介します。

What is Genbank?

Genbankとは、アメリカ合衆国にある米国生物工学情報センター(National Center for Biotechnology Information)が提供している、塩基配列データを蓄積・提供している世界的な公共の塩基配列データベースです。世界中の生物学の研究者は、自分の解析した塩基配列をここに登緑します。「外国のデータベースに登録するのだからそれは大へんでしょう」と思った方には申しわけありませんが、入力方法の説明は日本語でなされています。実は、このGenbankはアメリカヨーロッパ日本が連携して運営しています。そのため、日本には国立遺伝学研究所が作成する日本DNAデータバンクがあるため、日本語の入力説明があるというわけです。日本の研究者はだいたいここを通して登録します。後でもまた述べますが、Genbankの日本の窓口があるため、当特の不備などは日本人の担当者から連絡がきます。

何が大変なの?

A,T,G,Cの4種類の文字を登録するだけなら簡単なのですが、大変なのはアノテーションと呼ばれる注釈を同時に登録しなければならないことです。登録する内容について、登録時の画面を少しだけお見せしながら紹介します。ただ、研究分野によって扱う塩基配列の性質が違うので、誰もが今回紹介するような形で行うわけではありません。例えば、ヒトの塩基配列情報は別扱いになりますし、次世代シークエンスを使用した研究であれば膨大なデータ量を登録することになります。私のように人畜無害な寄生虫の塩基配列を少しだけ登録をするのとは異なります。

登録する前に、登録する塩基配列がどのようなものか聞かれます。質問に答えると適切なフォームに案内してくれるのですが、最近できたみたいで助かりました。
赤で囲った8つの項目を記入していきます。

まずは、“Contact person(対応する人の所属と連絡先)””Hold date(登録する塩基配列の公開日)””Submitter(塩基配列を解析・登録した人)””Reference(解析した塩基配列を元にかかれた論文)”です。最初の4つの項目は、日本であれば国立遺伝学研究所の人とやりとりをするために必要な情報です。個人情報ばかりなので、最後の論文以外は公開されません。

自分で解析した塩基配列であると答えたのち、塩基配列のダイルを添付します。

次の”Sequence”では、解析した塩基配列情報(A,T,G,C)を入力します。自分で解析したことを申告して、ファイルを添付するだけです。

私の場合は、リボソームDNAかCox1(ミトコンドリアDNA)くらいしか使わないです。

Templete”はどの遺伝子を解析したのかを選択します。

最後に、”Annotation”を入力するのですが、登録する塩基配列の長さ, 塩基配列を解析した生物の情報(種名や寄生虫の場合は宿主), その生物の採集場所(国, 地域,緯度,経度),塩基配列の特徴など入力する情報は多岐にわたります。入力が終わったら、”Confirm(確認)”をクリックします。すると、入力に不備があるところを指摘してくれますので、指摘がなくなるまで修正を続けます。それでも不備は残っているようで、後日メールで修正箇所の連絡がきます。最初の頃は不備も多かったので、担当者の苛立ちがわかる長文のメールが届いていましたが、最近は「以下のように修正しておくので確認しておいてね」くらいになりました。大きな修正がある場合はメールのやり取りが2, 3往復あるのですが、こういうやりとりを母語である日本語でできるのはたいへん助かります。最終的に、最長2週間以内で登録が完了し、自分が登録した塩基配列に番号が割り振られ、世界中の人が使用できるようになります。

知っておいて欲しい

Genbankが世界中の研究で得られた塩基配列情報を管理し、無料で使用できるようにしてくれているのはとても助かっています。もし、塩基配列をどこかの企業が使用料をとって管理していたり、大学や博物館が独自に管理していたら、私は在野で研究ができなかったと思います。
「塩基配列情報なんて使わないよ!」という方がほとんどだと思いますが、私はこのGenbankの“共有”というあり方こそ本来のインターネットの使い方ではないかと思っています。SNSやYoutubeも共有するという点ではネットの目的を果たしているのですが、悪ふざけやデマの拡散などにも利用されることから、教育の分野ではネットは否定的に捉えられている印象があります。私が勤務している学校でも、コロナ禍でオンライン授業が必要になってから生徒にデバイスを持たせましたが、それまでは「PCやタブレットがあってもSNSか動画の視聴しかしないだろう(自分がそうだし)」と意見する教員がほとんどでした。このGenbankを利用すれば、以前に私が紹介した方法で系統樹を作ることができます。自分の生活に関係なくても、ネットにはフリーの論文やGenbankのような人類の叡智があって、利用できることを「知っておく」こともネットリテラシーの一つではないかと思います。

Twitterでもいろんな話をすることにしました。よろしければ、フォローしてください。


この記事が参加している募集

#生物がすき

1,401件

この記事が気に入ったらサポートをしてみませんか?