【とっても簡単に医科学トピック紹介4】RNA-Seq解析とは何か?
元動画はこちらです:
RNA-Seqとは
RNA-Seq(RNAシークエンシング)は、遺伝子発現解析の分野で革命をもたらした技術です。この手法は、サンプル中の全ての遺伝子の発現レベルを網羅的に解析することができ、研究者にとって非常に貴重なデータを提供します。
まず、RNA-Seqは特定の条件下でどの遺伝子がどの程度発現しているかを詳細に把握することができます。これにより、細胞や組織の状態を正確に理解し、病気のメカニズムや治療法の開発に役立てることができます。また、RNA-Seqは既知の遺伝子だけでなく、新規の転写産物やスプライシングバリアントを発見するのにも有効です。これにより、未知の遺伝子機能や新たな生物学的経路の解明が進み、科学の進展に大きく貢献します。
さらに、RNA-Seqは高感度かつ高精度な手法であり、低発現の遺伝子や微量のサンプルでも解析が可能です。これにより、微細な遺伝子発現の変化も検出でき、より詳細なデータを得ることができます。RNA-Seqは疾患研究、発生生物学、進化研究など、さまざまな分野で応用されています。特に、がん研究においては、遺伝子融合や変異の検出、治療反応の解析などに利用され、個別化医療の発展に寄与しています。
また、公共データベースに登録されたRNA-Seqデータを利用することで、新たな実験を行わずに既存のデータを再解析し、新たな知見を得ることができます。これにより、研究の効率が大幅に向上します。
動画の概要
イントロダクション
このエピソードでは、RNAシークエンシングの方法について説明します。RNA(リボ核酸)は、DNAにコードされた遺伝情報を運び、タンパク質の合成を行うために必要な分子です。RNAは植物、動物、微生物を含むすべての生物の細胞に存在します。RNAシークエンシングは、生物サンプルからRNAを解析するプロセスであり、質的および量的な遺伝子発現情報を提供します。質的情報はどのmRNAが存在し、どの遺伝子が発現しているかを示し、量的情報は遺伝子発現の相対的なレベルを提供します。
RNAの働き
分子生物学のセントラルドグマ(1957年に初めて記述)は、RNAの主な役割が二本鎖DNAにコードされた遺伝情報を運び、それをタンパク質に翻訳することであると示唆しています。最初のステップは、DNAにコードされた遺伝子からRNAを転写することです。この転写はRNAポリメラーゼによって行われます。RNAの情報はリボソームとアミノ酸を介してタンパク質に翻訳されます。したがって、生物サンプル中のRNAを解析することで、分子レベルで何が起こっているかを理解することができます。
RNAの準備
RNAは生物サンプルから容易に分離できますが、シークエンシングのために準備するには、まずRNAを二本鎖DNA(cDNA)に変換する必要があります。これには、逆転写酵素(RNA依存性DNAポリメラーゼ)を使用してcDNAの第一鎖を形成し、次にDNAポリメラーゼを使用して第二鎖を合成します。
RNAシークエンシングライブラリの作成
RNAシークエンシングライブラリの作成には複数のステップがあります。まず、cDNA合成の前に、分離されたRNAを断片化して短いリードシークエンサーに適した断片サイズにします。次に、断片化されたRNAをcDNAに変換します。
アダプターライゲーション
このステップでは、cDNA断片を次のステップであるアダプターライゲーションに適合させます。さらに、3' Aテーリングと呼ばれる追加のステップも行われます。このステップでは、アダプターがcDNA断片にライゲートされ、ライブラリ分子が増幅されます。NGSアダプターは、シークエンシングフローセルでのステップの準備や、マルチプレックス実験からのシークエンシングリードを正しいサンプルに割り当てるためのバーコード化など、いくつかの機能を果たします。最終的なライブラリは品質管理を経て、マルチプレックス化とシークエンシングの準備が整います。
方法
RNA-Seqライブラリの準備にはいくつかの方法があり、それぞれが異なる研究質問に答えるために使用されます。RNAシークエンシング実験を計画する際には、必要な情報の種類と使用する解析ツールを知ることが重要です。RNA-Seqから得られる質的情報の例としては、特定の細胞タイプで発現している転写産物の注釈や新規転写産物の同定があります。量的データの例としては、異なるサンプル間での差次的遺伝子発現の測定や、処理されたサンプルと未処理のサンプル、健康な組織と病気の組織、異なる発生段階の比較、外部刺激に応答するオルタナティブスプライシング転写産物の同定などがあります。
<付録>動画の原文を書き起こしました ※視聴の際にお使いください
Intro
Welcome to the Ask a Scientist video series. In this episode, we'll talk about how the sequencing of RNA is performed.
What is RNA sequencing
RNA stands for ribonucleic acid and its main function is to carry genetic information encoded in DNA for the synthesis of proteins to carry out cellular functions. RNA is present in all living cells, including plants, animals, and microbes. RNA sequencing is the process of sequencing the RNA from a biological sample. The results can be qualitative, telling us what mRNAs are present and which genes are expressed, or quantitative, which provides information about relative gene expression. More transcripts from a gene mean higher expression and fewer mean lower gene expression.
How does RNA work
The central dogma of molecular biology, first described in 1957, suggests that the primary role of RNA is to carry genetic information encoded in the double-stranded DNA to be translated into proteins, which then carry out biological processes and ultimately all cellular functions. The first step is transcription of RNA from the genes encoded in the DNA, illustrated by the bars in the image. Transcription is carried out by RNA polymerases. The information in the RNA is then translated into proteins via ribosomes and amino acids. Thus, by analyzing the RNA present in a biological sample, we can gain insights into what is going on at a molecular level.
RNA preparation
RNA can be isolated readily from biological samples. However, to prepare RNA for sequencing, it first must be converted into double-stranded DNA molecules that can serve as a template for DNA polymerases during NGS library preparation. These DNA copies are called complementary DNA, or cDNA. The generation of cDNA is initiated by using reverse transcriptase enzyme, which is an RNA-dependent DNA polymerase, and priming to form the first strand of cDNA. The second strand is then synthesized through the use of DNA polymerase to generate the double-stranded cDNA.
Making an RNA sequencing library
Making an RNA sequencing library involves multiple steps. First, prior to the cDNA synthesis I just described, the isolated RNA is typically fragmented to produce fragment sizes that are compatible with short-read sequencers. The fragmented RNA is then converted to cDNA.
Adapter Ligation
This makes the cDNA fragments compatible with the next step, adapter ligation. An additional step called three-prime A tailing is also performed. In this step, adapters are ligated to the cDNA fragments, and the resulting library molecules are amplified. NGS adapters perform several functions, including preparing the cDNAs for the steps performed on the sequencing flow cell and barcoding each sample so that the sequencing reads from multiplex experiments can be assigned to the correct sample when analyzing the data. The final libraries are now ready for QC, followed by multiplexing and sequencing.
Methods
There are several different methods for RNA-seq library preparation, and each provides answers to a subset of research questions. Thus, when planning RNA sequencing experiments, it's important to know which kinds of information you need. Additionally, it is important to know what types of analysis tools you plan to use to analyze the RNA sequencing data. Some examples of qualitative information that can be gained from RNA-seq are the annotation of transcripts expressed in a particular cell type or the identification of novel transcripts. Some examples of quantitative data include the measurement of differential gene expression between different samples, such as treated or non-treated samples, healthy and diseased tissues, and different developmental stages, or the identification of alternately spliced transcripts, perhaps in response to an external stimulus.
今回は以上です。お役に立てれば幸いです。