見出し画像

【重版決定】進化で読み解く バイオインフォマティクス入門(長田直樹)

近年、生物学だけでなく、医学・薬学・農学など、さまざまな領域へ裾野を広げているバイオインフォマティクス。それに伴い、実際の解析のために必要な知識も複雑さを増してきており、「興味はあるけど何から始めたらいいのかわからない」という方もおられるのではないでしょうか。

本書『進化で読み解く バイオインフォマティクス入門』は、バイオインフォマティクスの理論を背後から裏付ける「生物の進化」の視点から、

 ・そもそも「生命情報」とは何か?
 ・遺伝子から情報が読み取れるのはなぜか?
 ・解析によってどのような知見が得られるのか?

という最も基本的、かつ重要な疑問を出発点とし、古典的な進化遺伝学の基礎から最新のトピックまで、見通しよく解説しています。これからバイオインフォマティクスを学びたい方は、ぜひ手にとってみてください。

画像1

このたび、ご好評につき増刷が決まりました。
重版を祝して、本書のまえがきを公開します。

***

『進化で読み解く バイオインフォマティクス入門』まえがき

著:長田直樹

本書のタイトルにあるバイオインフォマティクス(bioinformatics)とは、広義には、コンピュータを用いて生物を研究する学問分野を指す。しかし、コンピュータが日常的に利用される現在、生物を扱う研究において、コンピュータを用いない領域は存在しないといってよい。塩基配列の決定からデジタル観測データの収集・解析まで、コンピュータを用いて情報を解析する技術は、生物学のあらゆる分野においてなくてはならないものになっている。それでは、本書が解くバイオインフォマティクスとはどのような意味をもっているのだろうか。あまりに定義を広くとってしまうと、とても1冊の本ですべてをカバーすることはできないので、歴史をさかのぼって、生物と情報とのかかわりについて考えてみよう。

バイオインフォマティクスという学問分野は、歴史的にいくつかの領域から成り立ってきた。生物学は元来博物学的な記載が中心の学問であったが、1940年代にDNAやタンパク質の物質的な正体が明らかになってくると、それまで生物学とは無縁であった多くの物理学者や化学者が生物の研究を始めるようになった。その後分子生物学とよばれるようになったこれらの研究分野は、生物を精密な機械と捉え、それが機能を果たし生きていくための機構を明らかにすることを目的としていた。一方、それより以前の生物学者は、生物で普遍的に見られる遺伝の仕組みを「遺伝子」という抽象的な概念で捉えていた。遺伝は生物の進化を考えるうえでも重要な要素と考えられた。遺伝子は生物を作り上げる「情報」を次世代に受け渡し、その情報が突然変異により変化することで進化が起こる。これら二つの研究の流れは、1953年に、ワトソンとクリックらがDNAの二重らせん構造を解明することによって遺伝子の本体が明らかにされ、その後DNAからタンパク質への情報の伝達(セントラルドグマ)の仕組みが解明されることにより、融合した一つの研究分野を形作っていった。個人的な見解では、現在のバイオインフォマティクス分野は、この二つの領域の研究をもとに形作られたと考えられ、そのコンセプトが本書の内容に反映されている。つまり、生命情報という視点から生物というものを理解できるようになることが、本書による学習の到達点の一つである。

本書において中心として扱われるキーワードは遺伝ゲノム情報の三つであり、これらのキーワードを束ねるものとして、進化の概念がある。進化の概念は、これら三つの要素を俯瞰し、一つの統合された概念として理解するために役に立つものであるため、本書ではとくに重点を置いて解説を行っている。生物学の歴史における有名な言葉の一つに、テオドシウス・ドブジャンスキー(Theodosius Grygorovych Dobzhansky)による、「生物学では、進化の光なくしては何事も意味をなさない」というものがある。生物というものを理解するには、進化的な視点が必要不可欠であるという意味であり、本書はこの視点を重要視した内容となっている。

本書はもともと、私が担当する北海道大学工学部生体情報コース3年次における講義、「生命情報解析学」のために書かれたものである。生物、工学、情報学を幅広く学ぶことのできるコースであるため、さまざまな専門的背景をもった学生が聴講することになっている。したがって、本書は生物に関する基礎知識から統計学・情報学の基礎までを幅広く含む内容になっている。大学学部生にとっては若干専門的すぎる部分もあるが、大学学部生だけでなく、これから本格的に研究を始めようと思う大学院生、または、これからゲノムデータや遺伝子発現データを扱い始めたいと思っている生物学他分野の研究者にも有用であると思う。

これまで出版された多くのバイオインフォマティクスに関するテキストは、情報解析についての数理的な側面を詳細に掘り下げていくか、ソフトウェアなどのツールの使い方を中心に扱っているものが多かった。しかし、手法を用いる意義や応用方法についての生物学的な正しい理解がなければ、その手法を上手に利用することは難しいだろう。バイオインフォマティクス分野の広がりとともに、研究で用いられる方法は複雑多岐になり、論文として発表されている研究方法であっても多くの基礎的な間違いを含むものも多い。本書は、進化という軸を通して、ゲノムデータ解析などのバイオインフォマティクス研究を行うにあたって最低限必要な手法の意義や理論的背景を理解することができるように構成されている。

本書は全11章で構成されている。序盤の第1章、第2章ではそれぞれ、分子・ゲノムに関する基礎知識と、遺伝・進化に関する基礎知識について学習を行う。すでにある程度の知識をもっている読者は、これらの章に関しては飛ばしてもかまわないだろう。第3章から第10章までは、実際に行われる解析の手法や、その原理について解説を行う。各章の最初で、どのような考えで解析が行われているか、その歴史や生物学的な意義を概説し、さらにどのような応用が行われているかについて述べる。手法の紹介後、章の最後では、実際の研究を行うにあたって有用なソフトウェアの紹介を行う。第11章では補足として、ウェブ上でアクセスすることのできるデータベースについて簡単に解説を行う。データベースはバイオインフォマティクス研究にとって非常に重要な役割を担っているが、本書では簡単な紹介に留めることとする。また、最後には補遺として、本書でたびたび登場する、確率に関する基礎知識の紹介を行う。本書を理解するための助けとしてほしい。

ソフトウェアについては、学術研究目的に無償で提供されているものを中心に紹介している。いくつかのソフトウェアはWindowsやmacOSで動くものもあるが、多くはUnix/Linux互換のOSで動くものである。これらのソフトウェアの多くはコマンドラインを用いて起動する必要があり、Unix/Linux操作の基本的な知識が必要となってくる。本書ではソフトウェアの使い方についての詳細なチュートリアルは行わないが、多くの場合ウェブ上に十分な情報が掲載されているので、コマンドの打ち方やソフトウェアのインストール法については各自学習していただきたい。また、近年のバイオインフォマティクス解析ツールは、RやPythonといったプログラミング言語による解析パッケージとして提供されていることが多い。Pythonは近年普及が進んでいるプログラミング言語で、コードの視認性がよい。また、Biopython(*1)というバイオインフォマティクス解析用のパッケージがあり、多くの解析プログラムが開発されている。バイオインフォマティクスを片手間ではなく、きちんと習得したい方は、これらのプログラミング言語の習得にも時間を割いておいたほうがよいだろう。大量のデータを自由に操り、生物学的に意味のある結果をわかりやすい形で表現することがバイオインフォマティクス研究の中心的な作業であり、プログラミング言語をマスターすることによって、この流れを自由に操ることができるようになるだろう。生命情報を扱う研究領域は常に広がり続けている。現在は、核酸やタンパク質だけではなく、代謝産物を包括的に解析するメタボローム(metabolome)解析や、生命現象をシステムとして捉えるシステム生物学(systemsbiology)といった研究も広く行われている。これらの分野の研究については本書では取り扱わないので、発展的な内容として各自で学習していただきたい。

*1 Biopython: https://biopython.org/

なお、2017年に、私も所属する日本遺伝学会より、遺伝学用語の改訂が提案された。これまで慣れ親しまれてきた、優性・劣性という用語が顕性・潜性という表現になるなど、いくつか大きな改訂が行われた。今後更なる変更があるかもしれないが、原則として、本書ではこの新しい用語を採用することにしている。

出典:『進化で読み解く バイオインフォマティクス入門』

【著者紹介】
長田直樹(おさだ・なおき)
北海道大学大学院情報科学研究科准教授

目次
第1章 分子・ゲノムに関する基礎知識
第2章 遺伝と進化に関する基礎知識
第3章 集団内・種内の配列解析法
第4章  種間の配列比較法
第5章  配列のアラインメントと相同性検索法
第6章  分子系統樹作成法
第7章  機械学習による予測法
第8章  遺伝子配列決定法とアセンブル法
第9章  遺伝子発現情報解析法
第10章 タンパク質解析法
第11章 データベースへのアクセスとその利用法

この記事が気に入ったらサポートをしてみませんか?