見出し画像

遺伝学的検査結果の見方

近年、次世代シーケンサーという遺伝子の配列を高速に読み取る技術の出現により、未診断疾患の研究が進み, 遺伝性疾患の原因がわかるようになってきています。多くの臨床医が遺伝学的検査に関わる時代となりました。これらの遺伝学的精査の結果の評価には臨床医による診断の見立てをもって完結します。誤った解釈がされている報告書も散見されます。臨床医にとって遺伝学的検査の正確な解釈が望まれます。
臨床遺伝の現場を通して、臨床医が結果の解釈で押さえておくべき以下のポイントについてまとめます。
①検査結果の報告書でまず見るべきポイント
②バリアントのデータベース
③メンデル遺伝病を起こす遺伝子の特徴(gain-of-function, loss-of-function)
④バリアントの病原性予測スコア
⑤次世代シーケンサーによる解析の限界

本題に入る前に遺伝子についての説明です。
体を形作る細胞の中に核という入れ物があり, その中には染色体という46本の器があります. その中に二重らせんのDNA(デオキシリボ核酸)という形で遺伝の情報は保存されています。A(アデニン)、G(グアニン)、C(シトシン)、T(チミン)という4種類の文字の情報で成り立ち、トータルで60億の文字の情報になります。
これらは3文字で1組のコドンを形成し、それぞれ、アミノ酸をコードします。これがつながることで最終的にタンパク質が作られ、体の中で機能します。

画像4

セントラルドグマ

①検査結果の報告書でまず見るべきポイント
1-1 行われた検査の種類
サンガーシーケンス(特定の遺伝子のみ)
ターゲットパネルシーケンス(特定の遺伝子、エクソンのみの場合が多い)
全エクソーム解析(エクソンのみ)
全ゲノムシーケンス(全ゲノム)
対象としている領域、それぞれの検査に検出できる領域の限界があります。
1-2 得られた結果
報告書の記載例:
chr1:166894440 (GRCh37), SCN1A:c.2792G>C (p.Arg931Pro),
NM_001165963.4
病的と考えられるバリアントを検出した。

報告書により記載の仕方は異なりますが、上記が核となる情報です。
chr2:166894440 (GRCh37)、これはGRCh37はリファレンス配列内での番地のような情報です。これは2番染色体の166894440番目の塩基(文字)が欠失していることを示しています。GRCh38という地図もあり、その場合は番地の番号が変わるので注意が必要です。
SCN1A:c.2792G>C (p.Arg931Pro) 
SCN1A:これが遺伝子の名前です。遺伝子毎に体の中でどのような働きをしているかが違います。病名と直結します。SCN1AはDravet症候群の原因遺伝子です。
NM_001165963.4:同じ遺伝子名でもエクソンの一部を含んだり含まなかったり(alternative splicingという現象)によりいろいろな長さのRNAが作られます。どのNM番号が用いられるかで、後述するc~の番号やp~の番号が変わります。各遺伝子で代表的なNM番号が決まっており、共通して使われることが多いですが、異なることもあるため要注意です。
c.2792G>C:SCN1A遺伝子の翻訳開始点から何番目の塩基(文字)に変異があるかを示しています。この場合は2792番目の塩基がGからCに変化しています。
p.Arg931Pro:変異によりアミノ酸がどのように変化をしたか。931番目のアルギニン(Arg)がプロリン(Pro)に変わったことを示しています。

②バリアントのデータベース
遺伝情報の判断は過去のバリアントのデータベースの情報によって判断をしています。gnomAD(https://gnomad.broadinstitute.org/)のデータベースjMorp(https://jmorp.megabank.tohoku.ac.jp/202102/)などの正常人のデータベースをまず参考にします。これは健康なヒトのデータベースのため、登録されている場合は疾患の原因である可能性が非常に下がります。
ClinVar(https://clinvarminer.genetics.utah.edu), HGMD(professionalは最も有用だが有料)は病的バリアントを検索するのに有用であり、病的として登録がされていれば登録があれば病的変異である可能性が非常に高いです。

画像2

画像3


③メンデル遺伝病を起こす遺伝子の特徴(gain-of-function, loss-of-function)
遺伝子毎に疾患の原因となる機序が異なります。主に2つの機序があります。gain-of-functionはタンパク質を構成するアミノ酸が一部変わったために、本来と異なった機能を獲得したことが原因となる場合、loss-of-functionはタンパク質が正常に作られず、機能を喪失することが原因になる場合を言います。
同じ名前の遺伝子は父母から1つずつ引き継ぎ、2つ持っている(X染色体を除く)ので、1つの遺伝子しか働かない(ハプロ不全)となります。
gain-of-functionでしか疾患を起こさないはずなのに明らかにloss-of-functionを起こしている場合は結果の解釈が間違っている可能性があります。
そのほかに、dominant negative(タンパク質の構造が変わり、正常な遺伝子の機能を低下させてしまう)などの機序もあります。

④バリアントの病原性予測スコア
最近、特に有用性が高いと考えられるのがCADD(Combined Annotation Dependent Depletion: https://cadd.gs.washington.edu)です。これはSIFTやPolyPhen-2といった従来使われてきたいろいろな病原性予測スコアを組み合わせてアンサンブル学習でスコアを出す方法です。臨床症状もあっており、これが20以上であれば疾患特異的である可能性が高くなります。逆に10以下であれば病的ではない可能性が上がります。

スライド1

⑤次世代シーケンサーによる解析の限界
サンガーシーケンスでは遺伝子の一部が大きく欠失しているなどの情報が評価できません。
次世代シーケンサーでは遺伝子の一部の欠失や重複をみつけられる可能性は十分にありますが、変化の仕方によっては見落とすことがあります。トリプレットリピート病と呼ばれる3塩基(文字)が数百から数千文字にわたって伸びてしまうことが原因で起こる疾患です。ハンチントン舞踏病などがあたりますが、主流のショートリードシーケンス解析では評価ができません。Beckwith-Wiedemann症候群などのインプリンティング疾患は配列は変わらず、シトシンにつくメチル基による修飾が関わるため、文字の変化が読み取れず、評価ができません。

以上です。参考にしてもらえる方がいれば嬉しいです。




この記事が気に入ったらサポートをしてみませんか?