適応的な配列分岐がヒトの新しい神経発達エンハンサーを鍛え上げる
記事|185巻24号、P4587-4603.e23、2022年11月23日号
適応的な配列分岐がヒトの新しい神経発達エンハンサーを鍛え上げる
ライリー・J・マンガン
フェルナンド・C・アルシナ 6
フェデリカ・モスティ 6
ティモシー・E・レディ
デブラ・L・シルバー
クレイグ・B・ロウ 9
すべての著者を表示する
脚注を表示するオープンアクセスDOI:https://doi.org/10.1016/j.cell.2022.10.016
適応的な配列分岐により、ヒトの新たな神経発達エンハンサーが作り出された
ハイライト
HAQERsは、ヒトとチンパンジーの祖先から大きく分岐したヒトゲノム領域である
HAQERは高い突然変異率と正選択のもとで進化してきた
HAQERは二価クロマチンと疾患に関連した変異に富んでいる。
HAQERの分岐は、発達中の大脳皮質におけるホミニン特有のエンハンサーを作り出した。
研究概要
ヒトに特有の形質の遺伝的基盤を探る研究は、既存の機能要素の適応的改変を反映する、保存されたゲノム領域のヒト特異的分岐に焦点を当ててきた。しかし、保存された領域の研究では、以前は中立だった領域から派生した機能要素は除外される。本論文では、ヒトゲノムの最も速く進化した領域(我々が「ヒト祖先迅速進化領域」(HAQERs)と呼ぶ)が、ヒトとネアンデルタール人の分岐前に、方向性のある正の選択によって急速に分岐し、その後、ヒト内で制約に移行したことを証明する。HAQERは、特に消化器系や神経発達系の組織で二価のクロマチン状態や神経発達系疾患に関連する遺伝子変異に濃縮されている。我々は、マルチプレックス、シングルセルin vivoエンハンサーアッセイを開発し、HAQERの急速な配列分岐が、発達中の大脳皮質にホミニン特有のエンハンサーを生成することを発見した。我々は、多面的な制約の欠如と高い突然変異率によって、HAQERは急速に適応し、その結果、病気にかかりやすくなったことを提案する。
図解要約
図のサムネイルfx1
大きな画像を見るダウンロード 高解像度画像
キーワード
人類進化
神経発達
比較ゲノム科学
人類遺伝学
HAQER
ヒト加速度領域
はじめに
ヒトは、二足歩行運動1、頭蓋顔面形態2、顕著な認知能力3,4など、多くのユニークな表現型によって近年の類人猿の祖先と区別される。これらの適応と関連して、膝変形性関節症5や統合失調症6などのヒト特有の疾病感受性がある。しかし、ヒトと類人猿の祖先との間に存在する数百万の変異を、中立的に進化する変異とヒト特有の形質に大きく寄与する変異とに区分けすることは困難であった。
しかし、ヒトとチンパンジーはアミノ酸配列にほとんど違いがなく、ヒト特有の表現型の原因となる変異は、主にタンパク質をコードしていない制御領域に存在するという仮説が長い間信じられてきました12,13,14。
第二世代のスクリーニングは、種を超えた保存性を利用して、非タンパク質コード化ゲノムの機能的に重要な変異を濃縮することができるという洞察から始まりました。これにより、タンパク質をコードしているゲノムの1%から、高度に保存された制御要素を含むゲノムの5%まで、スクリーニングを拡大することが可能になった。これらのスクリーニングから得られたゲノム領域は、ヒト加速領域(HAR)と呼ばれている15。これらのスクリーニングは、ヌクレオチド置換速度の加速に基づきHARを同定した。過去15年の間に、より多くのゲノムアセンブリ、特定の目的の組織、そして別の統計的手法を加えた研究が行われ、HARのセットが拡大された16,17,18,19。
20,21 一つの例は、神経発達遺伝子FZD8の遠位エンハンサーであり、ヒト特異的な配列変化がマウス胚脳におけるエンハンサー活性を高め、神経前駆細胞周期のダイナミクスを加速し、脳のサイズを大きくするのに十分であった22。神経発生に重要な役割を持つゲノム領域で予想されるように、HARの変異は統合失調症や自閉症スペクトラム障害と関連している6,23。
ヒトに特有の形質について、高度に保存された領域を前提にした研究は、ゲノムの5%に解析を限定している。しかし、ゲノムのはるかに多くの領域が機能的であることを示唆する証拠が増えつつある24,25。我々は、ヒトの遺伝子変異をカタログ化するコンソーシアムの取り組み26と、近年のハイスループット機能ゲノム技術27,28,29,30の組み合わせにより、比較ゲノム、集団ゲノム、機能ゲノムが統合されて、ゲノム全体で機能的に重要な制御革新を識別する道が開かれると提案する。
ゲノムの残りの95%には、これまでの研究では対象とされなかった進化的に重要な2種類のゲノム領域が含まれている可能性が高い。すなわち、独立した系統で繰り返し改変される機能要素と、ヒトに特有の機能要素である。脳の大きさ、四肢の比率、頭蓋顔面の形態など、ヒトの解剖学的特徴の多くは、ヒト以外の種では固定的ではなく、むしろ脊椎動物の全生涯にわたって動的である。したがって、これらの動的形質の遺伝的決定要因の多くは、ヒトと非ヒトの両種において進化の速度が速く、したがって過去の制約という厳しい条件なしに機能を発揮すると予想される。さらに、種を越えて保存されている領域は、純化選択を受けて進化してきたものであり、最近進化した機能的要素がヒトでのみ制約を受けていることはないだろう。このような制御上の工夫は、いずれも保存されていないゲノムから発見される。
本研究では、比較ゲノム解析とヒト集団の遺伝子変異データを統合し、ヒトゲノムの最も速く進化した領域(我々が「ヒト祖先迅速進化領域」(HAQERs)と呼ぶ)が、高い突然変異率と正の選択の組み合わせによって急速に分岐したことを証明する。HAQERはヒトとチンパンジーの祖先から急速に分岐したが、現生人類と古生人類の間では非常によく似ている。HAQERは、時空間的に制限された発生や環境応答的な制御要素に関連する二価のドメインに富んでいる。我々は、マウス大脳皮質のエンハンサーアッセイとして、in vivo single-cell self-transcribing active regulatory region sequencing (scSTARR-seq) を開発し、急速なHAQER分岐によりヒトにしかない機能要素が作り出されていることを示した。また、HAQERは疾患と関連した変異に富んでおり、ヒトに特有の疾患感受性を形成する上で積極的な役割を担っていることが示唆された。
研究成果
加速度と速度は、正の淘汰のシグネチャーと関連している
歴史的に、ゲノム領域における高い分岐率は、選択ではなく、主に局所的な突然変異率の変動に関連すると考えられてきた31。これは、ヒトと類人猿の間の遺伝的差異の大部分は選択的に中立であり、正の選択はまれであるという考えに基づいている32。
加速度は、分岐速度の変化が選択圧力の変化を反映すると提案され、局所的な突然変異率の影響を緩和する指標として採用されてきた。この方法は、高度に保存されたゲノムにおいてさらなる研究のための刺激的な候補としてHARを同定するために有益に適用されたが、この戦略では調査範囲が初期速度がゼロに近い領域に限られ、中立から急速に分岐が加速した領域は除外される。そこで、加速度を一般化して、ゲノムの残りの95%の領域で正選択の標的を特定することを目指した。
ゲノム領域の加速度を、現在の分岐速度vと分岐の初期速度v0の差として、aα Δv=v-v0と定義した。 v0をヒト・ゴリラ祖先からヒト・チンパンジー祖先への分岐における分岐速度、vをヒト・チンパンジー祖先から現生人類への分岐速度として定義した(図1A)。v0とvはともに100万年あたりの塩基対あたりの遺伝的距離の単位で測定されており、距離は500bpのウィンドウ内の置換、挿入、欠失の合計としてカウントされる。v0は、ヒト、チンパンジー、ゴリラ、オランウータンのリファレンスゲノムのシンテニックアライメントからゲノムワイドに計算することができる。
図1サムネイルgr1
図1HAQERs、ヒトゲノムの中で最も速く進化した領域
キャプションを表示
大きな画像を表示する 高解像度画像を表示する
加速度が選択圧を予測できるかどうかを理解するために、アフリカの集団における派生対立遺伝子の頻度26を分析し、加速度値でビン分けしたゲノム領域の変種に作用する選択の方向と大きさを推測した(STAR Methods)。負の選択下では、派生対立遺伝子は祖先の対立遺伝子よりも劇的に変化するため、高い頻度で拡散することはない。正の淘汰の下では、派生した対立遺伝子は有益であり、より高い頻度で見出される可能性が高い(図S1A)。我々は、マルコフ連鎖モンテカルロ法34を用いて、由来対立遺伝子頻度スペクトル(dAFS)から平均選択パラメータを推定する統計モデルを実装し、分岐に基づいて領域を特定する際に生じる確認バイアスを補正した35(図S1;STAR Methods)。その結果、正の加速度は正の選択係数と関連しており(図1B)、ゲノム全体における適応的イノベーションの識別に役立つ可能性があることが報告された。
図1.サムネイル図
図S1図1に関連する、合成対立遺伝子頻度データで検証した、派生した対立遺伝子頻度スペクトルから選択の強さと方向を検出するモデル
キャプションを表示
大きな画像を表示するダウンロード 高解像度画像
しかし、最も劇的に加速された領域は、依然として、機能が修正された領域や過去の制約を受けた領域(低v0、高v)を優先的に含み、機能修正再来の領域(高v0、高v)や中立的に進化した配列から最近生じた機能要素(中v0、高v)は犠牲にされることになる。そこで、ゲノム領域の速度と選択の関係を調べるために、ゲノム領域の変異を速度でビン分けしたdAFSを用いました。その結果、加速度と選択度の関係より、速度と選択度の関係の方が強いことがわかった(図1B、図1C)。
また、a と v の間には強固な関係が見られるが(図 S2A)、v0 と v の間には見られない(図 S2B)。このことから、メガベーススケールとは異なり、小さなスケールでの分岐率の地域差は、系統的な分岐を越えて安定した突然変異率の本質的な変動を反映しているとは考えにくいことが示唆された36。ゲノム上で速度と加速度が共分散していることがわかったので、2つの指標のそれぞれと選択との関係を切り離すことを試みた。もう一方の指標を制御すると、速度と選択の間には強い関係が見られたが、加速度と選択の間には関係が見られなかった(図S2C)。これらの結果から、急激な加速度は、主に選択の強い指標である急激な速度と相関があるという点で選択と関連していることがわかった。
図サムネイル図2
図S2系統スコアと選択の関係;種を超えて急速に進化した領域の遺伝子オントロジー、図1との関連性
キャプションを表示
大きな画像を見るダウンロード 高解像度画像
ヒトゲノムで最も進化が速い領域
これらの知見に勇気づけられ、私たちは、ヒトの系統で最も急速に進化した領域を特定するために、計算機によるスクリーニングを実施しました(図1A)。ヒト、チンパンジー、ボノボ、ゴリラ、オランウータンのシンテニックゲノムワイドマルチプルアラインメントを用いて、各アラインメント位置におけるヒト-チンパンジー祖先の各塩基状態の確率を推定した(STAR Methods)。より保守的に遺伝的差異を推定するため、祖先推定で80%以上の確率で塩基変化が推定された場合のみ、ヒト-チンパンジー祖先とヒトの間で分岐している部位とみなした(STAR Methods)。我々はこの保守的な方法を用いて、「乖離密度」を500bpウィンドウごとのヒト-チンパンジー祖先とヒトゲノムの間の遺伝的距離と定義している。もし突然変異が最も速く進化する10MBのゲノム領域で観察される速度でゲノム上に一様に分布していたとしたら、500bpのウィンドウで29以上の突然変異を観察することはまずないだろう(p < 10-6, Bonferroni-corrected binomial; STAR Methods)。そこで、我々はHAQERを、ヒト-チンパンジーの祖先とヒトゲノムを隔てる少なくとも29の進化的操作の分岐密度を持つゲノム領域と定義した(図1D)。我々は、平均長892 bpの1,581のHAQERを同定し、これらは合計でヒトゲノムの約1.41 Mbを含んでいる(図1E)。
我々はHAQERをその急速な分岐に基づいて特定したので、それらはHARやランダムに選択された中性代理領域(RAND)よりも高い速度を示すことになる(図1FおよびS2D; STAR Methods)。HAQERはRANDよりも有意に低い初速度を示したが、これはHAQERが保存に基づいて直接確認されたわけではないにもかかわらずである。HAQERはまた、HARやRANDよりも有意に加速しており、わずかに低い初速とその劇的な速度の組み合わせを反映している。
HAQERとHARはほぼ独立したゲノム領域であり、2,733個の拡張HAR23のうち、HAQERと重複しているのは6個だけである。注目すべき重複はHAQER0035で、これは神経発達で発現するよく研究されているRNA遺伝子33の一部であるHAR1に対応している(図S6C)。HAQERはまた、チンパンジーやゴリラの最も速く進化した領域とは大きく異なっている(図S2E)。このように、我々は高度に保存されたゲノムを超えて、ヒトゲノムの中で最も急速に進化した領域を示す1000以上の未解決の領域を同定することに成功した。
図サムネイル図6
図S6ホミニン特異的神経発達調節革新を伴うHAQERのゲノム状況;疾患と関連した変異がHAQERに重なる特徴、図4、5、6に関連する。
キャプションの全文を表示する
大きな画像を見るダウンロード 高解像度画像
HAQERの配列進化は、ネアンデルタール人の分裂以前に、高い突然変異率と方向性のある正選択の両方によって推進された。
ゲノム領域における急速な配列分岐は、局所的な突然変異率の変動または正の選択によって生じる可能性があるため、最近入手したハイカバレッジヒト集団のシーケンスデータを用いて、HAQER進化におけるこれらの力の相対的影響を明らかにしようとした26。我々はまず、血縁関係のないアフリカ人501人の変異体を、HAQER、HAR、RAND、ultraconserved element(UCE)、ENCODE candidate cis-regulatory element(cCRE)25、またはmissense variants(MISSENSE)に重複するサブセットに分割した(STAR Methods)。
これらの領域における現代人と推定されるヒト・チンパンジー祖先との間の多型部位と分岐部位の密度を計算した(図S3A;STAR Methods)。UCEs-過去1億年の間に配列の分岐がほとんどなかった地域45-は、RANDと比較して、分岐と多型の密度が非常に限られているのに対し、HAQERsは多型サイトと分岐サイトの両方の密度が著しく高いことが示される。
図3サムネイル図
図S3HAQER進化における変異率、固定、スペクトル;HAQERの集団構造解析のための30ウェイアライメント、図2に関連する。
キャプションを表示
大きな画像を表示するダウンロード 高解像度画像
我々は、HAQERとより高い突然変異率に関連するゲノム特徴の共起を観察し、HAQERにおける多型部位の密度上昇の根本的なメカニズムを示唆した。HAQERは、減数分裂組換え二本鎖切断ホットスポット(106重複、1.4倍濃縮、p<10-3)、および染色体末端に濃縮されており(図1EおよびS2F)、これらはいずれも局所的な変異率の上昇と関連している。また、HAQERは早い複製タイミング49(図S3C)にも濃縮されていることがわかり、減数分裂組換えの二本鎖切断ホットスポットに対する濃縮と整合的であった。また、減数分裂時の二本鎖切断とサブテロメア領域は、より高い組換え率と関連している50。そして我々は、HAQERにおいて組換え率のわずかな、しかし有意な上昇を観察した51 (図S3B)。GCに基づく遺伝子変換は、HARで観察される分岐の一因となりうるものとして以前に検討された。15 我々は、HAQERが弱いから強い分岐部位にわずかに富んでいることを見いだした。しかし、この濃縮はHARで観察されたものよりかなり弱い(図S3DとS3E)。これらの観察は、急速なHAQERの分岐が突然変異率の上昇によって引き起こされるという仮説と一致する。
多くのHAQERは変異率が高いように見えるが、これはこれらの同じ要素が機能を持ち、正に選択されたことを否定するものではない。実際、我々は、ヒト-チンパンジーの祖先とヒトゲノムの間で分岐している部位において、多型対立遺伝子に対して固定対立遺伝子の割合が著しく高いことを観察した(図S3F)52。ここでもまた、HAQERは、RANDや他のゲノム領域と比較して、高頻度由来の対立遺伝子の濃縮と中間頻度の対立遺伝子の枯渇によって駆動される正の選択のサインを示している(図2Aおよび図2D)。
図2HAQER配列乖離
図2HAQER配列の分岐は、ヒトとネアンデルタール人の分断以前に正の選択によって引き起こされた。
キャプションを表示
大きな画像を見るダウンロード 高解像度画像
集団間の選択圧の大きさを推測するために、各DAFSを5つの集団(西部のガンビア人、シエラレオネのメンデ、ナイジェリアのエサン、ナイジェリアのヨルバ、ケニアのウェブのルヘ)のそれぞれから分離した変種を含む5つの構成dAFSに分割した。各集団に作用する平均選択パラメータを、MCMCを用いて評価した(図2Bと2C;STAR Methods)。HAQERについては、分離部位に作用する平均選択パラメータの95%信頼区間は12.7-16.5の範囲内にあり、他の変種セットの区間と重なることはなかった(図2C)。ヒトの有効人口を104人と概算すると53、HAQERの塩基に対する平均選択係数はs = 0.000635からs = 0.000825の範囲になると見積もられた。
もしHAQERが方向性選択のもとで進化したのであれば、これらの領域について、ヒトとチンパンジーの間の変異はヒト内の変異よりもはるかに大きいと予想される。あるいは、多様化選択のもとでは、ヒトとチンパンジーの参照ゲノム間のHAQERの分岐は、代わりに方向性なしにヒトの変異が増加した結果である。これらの選択肢を調べるために、我々はHAQER、HAR、RANDの現代人、古代ヒト、チンパンジー配列のクラスター間で、クラスター分離の保守的指標であるDunn指数54の分布を分析した(図2E、S3H〜S3J)。ダン指数1以下の値は重複するクラスターを示唆し、1より大きい値は明確でよく定義されたクラスターを示唆する。
HAQERは、ヒトまたは古代ヒトの配列をチンパンジーの配列と比較した場合、RANDと比較してより大きなクラスタ分離を示した(図2E)。重要なことは、ほとんどのHAQERは、ヒトと古代ヒトの間でダン指数が1未満であり、古代ヒトのHAQER配列は、大部分がヒトの変動範囲内にあることを示唆していることである(図2E)。これらの結果は、チンパンジーとの分裂後、ヒトにおいて急速な方向性選択が起こり、その後、ヒトとネアンデルタール人との分裂の前に制約に移行したことと一致する。
dAFSモデルは無限のサイトを想定しているが、HAQERの中で派生対立遺伝子頻度が高いサイトは遷移の割合が高く、これは祖先状態へのバックミューテーションを持つサイトの特徴であることが観察された(図S3G;STAR Methods)。HAQERの多くの部位で派生対立遺伝子が有利であれば、祖先の状態への復帰変異はそれに比べて有害であり、これらの部位は派生対立遺伝子頻度が高い状態から中程度の状態へとドリフトすることはないだろう。したがって、HAQERで観察される高頻度の由来対立遺伝子の濃縮は、分岐した部位間の固定した差異(それ自体が正の選択のしるし)の過剰な存在、祖先の状態に戻る突然変異率の上昇、現代人における純化選択による由来状態の維持によって拡大されたのかもしれない。
突然変異率の変動は対立遺伝子頻度スペクトルに影響を与えるが55、我々の結果は、中立領域における突然変異率の上昇がHAQERの急速な分岐の唯一の原因であることを示唆するものではない。第一に、HAQERにおける中間頻度の対立遺伝子の相対的枯渇(希少対立遺伝子の濃縮として図2Dに提示)および多型部位と比較した固定分岐部位の過多は、選択的に中立な領域では予想されない(図S3F)。さらに、現代人とチンパンジーの間でRANDに比べてHAQER配列群の分離が大きいことは、分岐の上昇の原因として種内変動の拡大よりもむしろ方向性のある進化を示唆している。
HAQERはクロマチン状態に濃縮されている
HAQERが方向性のある正の選択によって進化したという結論は、これらの領域に適応的な機能があることを示唆している。この仮説を検証するために、我々は127の参照エピゲノム37にわたるクロマチン状態における濃縮と枯渇のゲノムワイドなパターンを分析した(図3AおよびS4A)。HAQERとHARはともに転写活性の高いクロマチン状態において著しく枯渇しており、タンパク質コード領域の外側で最も急速な進化が起こるという過去の報告15や、進化に対する非コード制御領域の重要性が予測されることと一致している13。
図 サムネイル gr3
図3HAQERは二価のクロマチン状態に濃縮される
キャプションを表示
大きい画像を見る ダウンロード 高解像度画像
図のサムネイル Figs4
図S4HAQERのクロマチン状態濃縮解析(図3関連
キャプションを表示
大きな画像を見る 高解像度画像
驚くべきことに、HAQERは活性エンハンサーやプロモーター状態には濃縮されないが、二価クロマチン状態には強く濃縮されることがわかった(図3A)。二価クロマチンは、ポリコーム抑制マークH3K27me3と活性プロモーターマークH3K4me3および/または活性エンハンサーマークH3K4me1の両方を保有し、アクティブでありながら急速に可逆的で、正確な活性化を可能にするサイレンシングによって、発生や環境応答性遺伝子を低いレベルで発現維持すると提案されている(56, 57)。
HAQERは、発生過程と成体の両方の初代組織において、二価のクロマチン状態に有意に濃縮されている(図S4C)。発生遺伝子制御プログラムの進化的変化は、等尺性関係を含む成体形態を変化させる可能性がある。このような劇的な変化と一致して、消化管と神経発達の参照エピゲノムでは、二価エンハンサークロマチンの状態が最も顕著に濃縮されていることが観察された(図3Bおよび図S4E)。成体組織における環境応答の一端として、抗炎症性グルココルチコイドであるデキサメタゾンに曝露した後、成体上皮細胞において2つのHAQERが二価エンハンサー状態から活性エンハンサー状態に移行することを観察した29 (enrichment p < 0.01; STAR Methods)。
観察された二価状態の多くは、個々のヒストンが活性と抑制の両方の修飾を同時に受ける領域(真の二価性)を表しているかもしれないが、バルクChIP-seqデータにおける二価状態の観察は、異種組織内の異なる細胞タイプにおける活性化と抑制の状態の差(混合細胞の二価性)の結果である可能性もある。しかし、培養細胞から得られた参照エピゲノムでさえ、二価の状態に対して有意な濃縮を示し、HAQERにおける混合細胞と真の二価の両方を示唆している。
いずれのシナリオにおいても、二価の状態にあるゲノム領域は、不均一な組織において一様な活性制御状態を持つ領域よりも、より限定された空間的・時間的な活性パターンを示すと思われる。HAQERとは対照的に、HARは活性エンハンサー状態に関連しており(図S4B)、これはより広く発現する遺伝子と関連していると考えられる56。したがって、二価性に富むことは、HAQERが発生や環境応答において高い特異性を持つ遺伝子制御要素をコードしていることを示唆している。
HAQERは最近進化した神経発達遺伝子制御要素に富んでいる
もし、HAQERで観察される適応的分岐が、発生遺伝子制御機能の革新の根底にあるとすれば、ヒトと近縁種の間でエピゲノムプロファイルに違いがあることが予想される。発育中の組織の種を超えたエピゲノムプロファイルはあまり公開されていませんが、発育中の大脳皮質は、ヒトの認知機能と関連していることから、ヒト、アカゲザル、マウスの間で、ヒトとアカゲザルの間の分裂後に獲得したヒトゲノムの推定エンハンサーとプロモーターのプロファイリングを行いました3。発達中の脳全体では、活性エンハンサーやプロモーターの状態と有意な関連は見られなかったが(図3AおよびS4A)、HAQERはアカゲザルの分裂後に獲得した活性エンハンサーやプロモーターのクロマチン状態のサブセットと重なり、濃縮されていることがわかった(図S4D)。HAQERと、発生段階や脳領域にわたって同定された推定的に獲得された遺伝子制御活性との間に濃縮が見られるが、HAQERは胚神経発生後期の前頭葉における獲得要素に最も濃縮されることを示した(図S4D)。
多重単一細胞in vivoエンハンサーアッセイにより、HAQERsにおけるホミニン特異的神経発達エンハンサー活性が明らかになった。
HAQERは嗅覚や細胞認識に関連する遺伝子の近くに濃縮され(図S2H)、神経系遺伝子と3次元クロマチン接触し(図S2G)、ヒトとアカゲザルの分裂後に獲得した神経発達調節要素に濃縮され(図S4D)、発達中の脳では二価エンハンサーに非常に濃縮されているので(図3B)、HAQER機能のin vivo分析に適した組織として発展中の脳を同定した。注目すべきは、脳がヒトの系統上で劇的に変化しており3、多くのヒト特有の疾患感受性と関連していることです23。
STARR-seqは、特定のテスト配列を含むRNA転写物の存在量からエンハンサー活性を定量的に測定する、ハイスループットなシーケンシングに基づくアッセイです27。STARR-seqは培養細胞株で効果的に利用されているが、27,29,59我々の結果は、HAQERが胚神経発達後期のような非常に不均一な組織において時空間的に制限された文脈で機能することを示唆している60。そこで我々は、in vivo scSTARR-seq を実施し、発達中の脳組織における複数のテスト配列のエンハンサー活性を同時に計測することにした。
このアッセイでは、DNA配列をSTARR-seqベクター27にクローニングし、インプットライブラリーを形成させた。インプットライブラリーを構成的GFPトランスフェクションレポータープラスミドとともに、子宮内エレクトロポレーション法により胚性マウス大脳皮質に注入した(図4A;STAR Methods)。16-18時間後に解剖した後、蛍光活性化セルソーティング(FACS)を用いてGFP+細胞を濃縮し、その後のシングルセルRNAシーケンスに使用した。この方法により、エレクトロポレーションした細胞とその直後の子孫におけるエンハンサー活性を調査することができました。
図のサムネイル gr4
図4HAQERの配列分岐により、ホミニン特異的な神経発達エンハンサーが生成された。
キャプションを表示
大きな画像を見るダウンロード 高解像度画像
ヒトの進化した神経発達調節要素の候補を同定するために、我々は3つのデータセットのいずれかに重なる105のHAQERを同定した:アカゲザルの分裂後に獲得した機能要素、38 発達期のヒト脳におけるオープンクロマチン、37 初期神経発達の多くの特徴を再現するヒトとチンパンジーの大脳器官間でクロマチンアクセス性に差がある領域39、61 (図4A). 我々は、絶滅した対立遺伝子や祖先の対立遺伝子を解析するために必要な、これらの配列のうち40種類を商業的に合成することができた。ヒトの対立遺伝子のみを用いたパイロットアッセイを実施し、最も強いシグナルを示した13個を選んで、ヒト(ヒト、ネアンデルタール、デニソワ)と非ヒト(チンパンジー、ヒトとチンパンジーの推定祖先)対立遺伝子間の完全比較分析を行った(Data S1)。
このインジェクションライブラリーを用いて2つの独立したin vivo scSTARR-seq実験を行い、STARR-seqレポーターリード、内在性RNAリード、およびトランスフェクションレポーターリードを7,170個の単一細胞から同時に回収しました(図4B)。これら2つの実験は、時間的に近い発生時点(E14.5とE15.5の注入)で行われたため、両実験におけるエンハンサー活性スコア間に強い相関が観察された(図S5EおよびS5F)。
図サムネイルfigs5
図S5scSTARR-seqクラスタ解析、マーカー遺伝子発現、注入時点と入力の正規化の影響、図4関連
フルキャプションを表示
大きな画像を表示するダウンロード 高解像度画像
HAQERのほとんどの急速な配列分岐は、ヒトとネアンデルタール人の分裂前に起こったので、我々は、ヒトの配列間でエンハンサー活性の類似したパターンを予想し、ヒトと非ヒトの配列間のエンハンサー活性を比較した。決定的なことは、13のHAQERのうち6つが、非ホミニン配列よりもホミニンオーソログテスト配列で有意に大きなエンハンサー活性を示したことである(図4C、S6A、S6B、S6D)。さらに、HAQER1032は、ホミンオーソログ配列において、小さいが統計的に有意なエンハンサー活性の減少を示した(図4C)。非ホミニン配列の多くは、ランダム配列のネガティブコントロールと同様のエンハンサー活性を示す。ヒト以外の対立遺伝子の機能が観察されなかったことから、これらのHAQERは、以前は中立的に進化していた配列から作り出されたヒト特有の機能要素であり、ヒト以外の機能制約に依存した過去の比較ゲノムスクリーニングからは除外されたクラスであることが示唆された。
次に、in vivo scSTARR-seqの単一細胞分解能を利用して、HAQERsの発生組織におけるエンハンサー活性の細胞型特異性を明らかにしようとした。我々は、発達中の脳細胞アトラス60,62を利用して、各細胞型に特異的なエンハンサー活性スコアを計算し、細胞型を注釈した(図4B、4D、S5A、S5B;STAR Methods)。子宮内エレクトロポレーションは、心室前駆細胞を優先的にターゲットとする。そのため、中間前駆細胞や新生興奮性ニューロンを含む放射状グリアと放射状グリア子孫において最も多くのGFPシグナルが観察された(図4BおよびS5C)。抑制性ニューロン、ミクログリア、線維芽細胞の細胞型アイデンティティを持つクラスターを分離したが、これらのクラスターはエレクトロポーレーションの標的になっていないため、限られたGFP発現しか示さなかった(図S5C)。したがって、細胞型特異的エンハンサー活性を計算する際にトランスフェクション効率の違いを制御するために、エンハンサー活性スコアを各クラスターで観察されたGFPの量に正規化した(STAR Methods)。我々の13のHAQER配列のうち5つが、少なくとも1つの細胞型において、ホミニン配列のエンハンサー活性の有意な増加を示したことが観察された。HAQER0911とHAQER1032はバルク組織でヒトと非ヒトの有意な差を示したが、統計的検出力が低いメタクラスターレベルでは同様の結果は観察されなかった。特に、HAQER0710は興奮性ニューロンにおいてホミニン特異的なエンハンサー活性を示したが、この結果はバルク組織では見えなかった(図4Bおよび4D)。この結果は、複雑な組織における細胞型特異的な遺伝子制御機能を明らかにするシングルセルテクノロジーの可能性を示している。
ヒト特異的脳エンハンサーの発見と直交する確認として、我々はHAQER0059のヒトおよびヒト-チンパンジー祖先配列を追加のプラスミドに導入し、エンハンサー駆動型EGFP発現について試験した(図5A;STAR Methods)。発生中のマウス脳に子宮内エレクトロポレーションを行った後、HAQER0059の祖先のオルソログではなく、ヒト構築物のエンハンサー駆動型EGFPの強固な発現を観察し(図5Bおよび5C)、独立した蛍光ベースの手法で我々の多重配列アッセイの妥当性を確認した。
図のサムネイル gr5
図5FOXD4ファミリー遺伝子近傍のホミニン特異的神経発達エンハンサーが、複数の分節重複を経て急速に分岐している様子
キャプションを表示
大きな画像を見るダウンロード 高解像度画像
HAQERの急速な分岐に続くヒト特異的パラログの分節的重複
我々は、多くのHAQERが最近のセグメント重複の中に含まれていることを観察した。これは、ヒト特異的な分節重複によって作られたパラロガス遺伝子間の発現差の有病率と一致する。61,63 我々が同定した二つのヒト特異的エンハンサー、HAQER0059とHAQER0074はそれぞれFOXD4とFOXD4L1のパラログの近くに位置している。FOXD4は、神経分化に必要なフォークヘッドファミリー転写因子64,65をコードし、精神疾患にも関与している。66 マウス、ゴリラ、オランウータンのゲノムアセンブリには、9番染色体上のヒト遺伝子FOXD4L3の位置に相当する1つのFOXD4パラログが含まれている。このことは、1つのFOXD4パラログが、類人猿の共通祖先に存在していたことを示唆している。現代人の9番染色体の短腕は、ゴリラやオランウータンのそれとは相対的に逆になっている。ヒトでは、FOXD4L3が逆位の破断点付近で見つかり、さらにFOXD4というパラログが9番染色体サブテロメアの逆位の反対側で見つかっており、ゴリラとの分裂後に一対の逆位と重複のイベントがあったことが示唆されている(図5F)。チンパンジーは2b染色体のサブテロメアにさらにパラログが存在し、セグメント重複があったことが示唆される。ヒトでは、このパラログはFOXD4L1に相当し、現代ヒトの2番染色体を形成した祖先染色体2aと2bの端から端への融合67の部位に位置している(図5F)。HAQER0059とHAQER0074はともにヒト-チンパンジーの祖先から大きく乖離しているにもかかわらず、STARR-seq挿入物として使用した500bp領域では97.6%の同一性を示した68(図5Dと図5E)。しかし、FOXD4L3付近のオルソログ領域は、祖先の配列からの乖離が大きくない。HAQER0059とHAQER0074の類似性は収斂進化で説明できるかもしれないが、これには100以上の並列変異が必要である。したがって、我々は、2つのパラログのうちの1つが急速に分岐し、その後の出来事で分岐の激しいパラログがもう一方の染色体上のパラログの位置に転座し、結果として2bと9番染色体の両末端に同じ高分岐の配列ができたと考える。
さらに、我々はNBPF遺伝子群を含む1q21.1-2領域で26個のHAQERを観察した(図S6E)。この領域にはいくつかのヒト特有のセグメント重複がある。10,69,70 NBPF遺伝子にはOlduvaiドメインがあり、ヒト系統のタンパク質コード領域の中で最もコピー数が急激に増加している70,71 オルドバイドメインのコピー数は脳の大きさと用量依存的に関係しており、この領域の欠失と重複はそれぞれ小頭症、大頭症と関連している72。これらの結果は、FOXD4とNBPFの適応的発現増加は、シス規制革新とセグメント重複のペア作用により達成されたという仮説と一致する。このように、独立した分子メカニズムの連携が、急速な進化に共通する方法である可能性を提唱している。
HAQERの進化がヒトの疾患感受性を形成する
HAQERと疾患の関係を調べるために、HAQERの分離変種がゲノムワイド関連研究(GWAS)を通じてヒトの疾患や障害と関連付けられたSNPsにリンクしているかどうかを計算した。GWASカタログの各バリアントについて、集団リシークエンスデータを用いて、報告されたSNPと連鎖不平衡にある追加の分離部位を同定した。我々は、特定のGWAS形質について観察されたすべての連鎖不平衡のセットを得るために、注釈付き形質と関連するすべてのGWAS SNPについてこの計算を行った(図6;STAR Methods)。HAQERは、高血圧、神経芽腫、単極性うつ病/統合失調症/双極性障害などのGWAS形質とリンクしたバリエーションに非常に富んでいる(図6B; STAR Methods)。
図サムネイルgr6
図6HAQERはヒトの疾患に関連する遺伝子変異の近傍に濃縮されている。
キャプションを表示
大きな画像を見るダウンロード 高解像度画像
HAQERの変異は、HAQER要素における有利な変異に対する選択が、独立した形質における有害な副作用を伴うような、多面的効果により疾患リスクと関連している可能性がある。単座多面性では、HAQERエレメントのDNAセグメントは複数の機能を持ち、有利な変化を選択された同じ変種は、それに付随するdeleteriousな変化を持ち、それが疾患感受性として実現される。HAQERは遺伝子座特異的なpleiotropyを示さず、単座pleiotropyスコアはHARのそれよりもずっと低く、RANDのそれと同様であることから、多くのHAQERはより特異的な機能を果たしていると考えられる(図S6H;STAR Methods)。あるいは、もしHAQERが最近の正の選択によって高いハプロタイプ長を示すなら、HAQERの疾患濃縮は連鎖不平衡によるpleiotropyの結果であると予想されるかもしれない。しかし、HAQERの分岐はヒトとネアンデルタール人の分岐以前にはほぼ収まっており(図2E)、選択に伴うハプロタイプ長の増加は数万年の時間スケールで組換えにより消滅するため、HAQERのハプロタイプ長が増加するとは考えられない73。実際、HAQERの分離部位はランダム領域よりも小さなハプロタイプ上に存在し(図S6FとS6G;STAR Methods)、これはそのわずかな組み換え頻度の上昇を反映している(図S3B)。したがって、HAQERの疾患濃縮が連鎖不平衡に起因するpleiotropyの結果であるとは考えにくい。HAQERはゲノム上の位置でも連鎖不平衡によっても有意な多面性を示さないので、HAQERに関連する疾患感受性は主に多面的効果によって駆動されているわけではないのである。
我々は、HAQERが変異率の高いゲノム領域に位置するため、ヒトにおいて疾患感受性をもたらすことを提案する(図S3B)。HAQERには一般的に後続の突然変異が起こり、これらの突然変異はしばしば劇的に変化し、疾患と関連することが予想される。多くのHAQERはヒトでのみ機能し、より一般的には、HAQERは他の種のHAQER様領域とは大きく異なる遺伝子オントロジーの濃縮を持っているので、これらの疾患感受性はヒトに特有であると思われる(図S2H)。したがって、HAQERの進化はヒトの系統において適応的であったが、疾患変異との関連は、結果としてヒトに特異的な疾患感受性を生み出す急速な分岐を示唆している。
考察
分岐の激しい領域が自然淘汰の作用を反映しているのか、それとも局所的な突然変異率の変動を反映しているのかについては、かなり意見が分かれているが、36人の研究者は、比較ゲノム研究にヒト集団遺伝データを慎重に統合すれば、選択と突然変異率の変動という相互に混乱するサインを有効に解決できると推測している75。
局所的な突然変異率の変動と正の選択は、急速に進化した領域の生成に関する相互に排他的な説明としてしばしば提示されるが、我々はHAQERにおいて正の選択と高い局所的突然変異率の両方の証拠を発見し、これら二つの力の組み合わせがヒトゲノムで最も多様な領域を形成したことを示唆するものであった。
重要なことは、HAQERの適応的進化が、ヒトと古代ホミニンにおいて機能的な結果をもたらしたことを明らかにしたことである。HAQERは二価クロマチンに強く濃縮されており、特に消化管、免疫系、発達中の脳において顕著である。我々は、マルチプレックス、単一細胞エンハンサーアッセイを開発し、HAQERの急速な配列分岐が、ホミニン特異的な遺伝子制御要素を作り出したことを証明した。
HAQERは、ヒト-チンパンジーの祖先に続く急速な進化から、現代人の間での制約へと移行した。ネアンデルタール人とデニソワ人のHAQER配列は、配列と機能の両方においてヒトの変動範囲内にあることから、HAQERの急速な分岐は、この集団分裂よりもかなり前に起こったことが示唆される。最近、ネアンデルタール人とデニソワ人のゲノムが入手可能になったことで、ヒトとこれらの絶滅したホミニンの違いに関する実質的な調査に拍車がかかっているが、二足歩行や脳の拡大など、ヒト系統の決定的表現型の変遷の多くは、我々と共通するものである。HAQERは、配列と機能の両方のレベルで、私たちヒトを、急速な分岐によって類人猿の祖先から引き離し、しかし現代の制約によって種として統合しているのである。
HAQERとHARは、その機能の解剖学的特異性において著しい類似性を示している。両者とも、脳と消化管に濃縮されていることがわかる。これらの一貫したゲノム上の濃縮は、脳の拡大と腸の縮小というヒトの系統上の既知の解剖学的変化と並行している。この2つの変化は、基礎代謝量を比較的一定に保つために共進化してきたと考えられている58。
HAQERとHARは影響を与える組織において類似性を示すが、我々はこれらのセットは脊椎動物の進化における制御の革新の異なるクラスを表していると提唱している。HAQERは中立領域から生成されたデノボ機能要素を含むが、HARは既存の機能要素の改変を表す。この見解は、選択パラメータ、クロマチン状態、多面的効果においてHAQERとHARの間に観察される違いと一致する。選択という点では、HAQERは中性配列から制御エレメントが作られる際に多くの塩基が正の選択を受けるという一峰性のモデルにより適しているのかもしれない。対照的に、HARは既存の機能要素の改変であり、その構成は、以前の機能を維持する負の選択下にある塩基と正の選択の影響を受けた塩基の混合であると予想される。従って、全ての部位で平均化された選択パラメータを評価する我々の選択モデルが、HARにおいて中立性からの大幅な逸脱を観測しないのは当然である。クロマチン状態に関しては、HAQERは時空間的に制限された制御文脈と関連する二価クロマチン状態に強く一貫した濃縮を示すが、HARはより広範に機能する活性エンハンサー状態に関連したものである。この機能特異性と一致するように、HAQERの多面的変異は限定的であるのに対し、HARは高度に保存された活性エンハンサーを改変することから予想されるように、実質的に多面的であることが確認された。この違いは、HARで修飾された古い多機能な制御要素に比べ、HAQERでは新しく、より特異的な機能があることと一致する。重要なことは、脊椎動物の進化や疾患に対する遺伝子制御エレメントの獲得、喪失、改変の相対的な寄与は依然として不明であることである。我々は、以前は機能しなかった領域から機能的な要素を作り出すことは、高度に保存された多くの発生エンハンサーの進化性を低下させる多面的な制約を回避することによって、種間の制御の違いに大きな役割を果たす可能性があると提唱している76。
正選択されたHAQERにおける高い突然変異率の観察は、脊椎動物ゲノムにおける進化可能性の非一様性によって説明される。例えば、海産魚のハリヨの個体群は、発生エンハンサーの欠失によって骨盤を小さくすることで淡水域に独自に適応してきた。77 骨盤の縮小は複数のエンハンサー欠失によって達成できるが78 、野生個体群は二鎖切断に非常に敏感な領域にある同じエンハンサーの欠失を繰り返し示す79 。79 多くの場合、多くの可能性のある突然変異が同じ適応的表現型を生み出す。同じような適応的突然変異が異なる割合で起こる場合、より高い割合で起こる突然変異が優先的に適応に使われることになる。実際、私たちはHAQERで突然変異率の上昇を観察し、このように正の選択領域で突然変異率が上昇するパターンは、脊椎動物全体に共通するものであると予想される。
適応進化に利用される超変異性領域には、減数分裂の際に二本鎖切断を起こしやすい領域など、派生状態でも変異性を維持するものがあるが、脆弱部位での欠失など、そうでない領域もある。79 我々は、派生状態で超変異性を維持する正の選択領域は、その後の有害変異によって生物を疾患感受性にさせることを提案する。実際、HAQERは、高血圧から神経精神疾患まで様々な疾患に関連するヒトの遺伝子変異を豊富に含んでいる。したがって、我々は、脊椎動物の進化の歴史において、突然変異率、正選択、および種特異的な疾患感受性が一般的に対応していることを期待している。
研究の限界
第一に、我々はパラログの不整列による分岐の過大評価を避けるために、保守的によく組み立てられたシンテニック領域に限定して解析を行ったので、類人猿間の高度な分岐領域はまだ多く見つかっていないと考えられる。ゲノムアセンブリのギャップの多くは、セントロメア、テロメア、高度パラロガス領域の近くに位置しており、これらはHAQERが濃縮されている領域でもある。これらの領域を発見するためには、類人猿のテロメア間のアセンブリを完了し、シンテニックな関係を解決することが必要であろう。第二に、ヒトとチンパンジーの祖先対立遺伝子の確実な祖先配列再構成には、類人猿種間の最小レベルの同一性が必要である。したがって、同じ塩基位置で異なる変異が多くの独立した系統で起こった整列可能な領域では、HAQERが見落とされる可能性がある。同様に、我々の現在の方法では、ヒトと他の類人猿がすべて独立して同じ派生状態に進化した位置での急速な進化を検出することはできない。第三に、我々は、in vivoでの機能解析を発達中の脳に焦点をあてて行った。HAQERが多くの解剖学的部位に影響を与えることを提案するが、HAQERを介した制御革新が多様な組織や段階にわたって標的遺伝子の発現や表現型の変化にどのように影響するかを明らかにするためには、今後の研究が必要であろう。最後に、いくつかの興味のあるHAQERは単純な繰り返し配列と重なっていた。これらのHAQERは、絶滅種や祖先種のハプロタイプを調べるために必要なDNA合成の現在の方法には限界があり、エンハンサー活性を調べることはできなかった。
STAR★Methods
主要リソース一覧
REAGENTまたはRESOURCE SOURCE IDENTIFIER
細菌・ウイルス株
Stbl3 化学的にコンピテントな大腸菌 Invitrogen Cat# C737303
化学物質、ペプチド、リコンビナントタンパク質
Agencourt AMPure Beads Beckman Cat# A63881
DNase-I New England Biolabs 社の Cat# M0303S
EcoRI New England Biolabs Cat# R3101S
Fast Green FCF Sigma-Aldrich Cat# F7252
FBS ThermoFisher Cat# 10438026
Hoechst 33342 Invitrogen Cat# H1399
NEG-50 Richard-Allan Scientific 社製 Epredia 6502
Phusion DNA Polymerase New England Biolabs Cat# M0530S
SphI New England Biolabs 社の Cat# R3182S
トリプシン-EDTA Sigma-Aldrich Cat# 59428C
ベクタシールド ベクターラボラトリーズ H-1000-10
ZymoPURE II Plasmid Maxiprep Kit Zymo Research Cat# D4203
重要な市販アッセイ
LIVE/DEAD Fixable Near-IR Dead Cell Stain Kit Invitrogen Cat# L10119
NovaSeq 6000 S-Prime 試薬 Illumina Cat# 20040719
Chromium Next GEM Single Cell 3' Reagent Kit v3.1 10x Genomics https://www.10xgenomics.com/support/single-cell-gene-expression/documentation/steps/library-prep/chromium-single-cell-3-reagent-kits-user-guide-v-3-1-chemistry
NEBuilder HiFi DNA Assembly Master Mix New England Biolabs Cat# E2621L
NEBNext Ultra II FS DNA Library Prep Kit New England Biolabs Cat# E6177
寄託データ
1000 Genomes Project genomes Byrska-Bishop et al.26 https://www.internationalgenome.org/data-portal/data-collection/30x-grch38
Altai Neanderthal genome Meyer et al.80 https://www.eva.mpg.de/genetics/genome-projects/neandertal/
ヒト加速領域位置の組み合わせ Doan et al.23 Doan et al.23のTable S1
Denisovan ゲノム Meyer et al.80 https://www.eva.mpg.de/denisova/index.html
ENCODE cCRE locations and ChromHmm Datasets Moore et al.25 https://www.encodeproject.org/
GWAS Catalog Variants GWAS Catalog https://www.ebi.ac.uk/gwas/
HiCAR H1 と GM12878 Wei et al.81 GEO: GSE162819
Human ChromHmm Roadmap Epigenomics Data Kundaje et al.37 http://www.roadmapepigenomics.org/
ヒトのゲインエンハンサー位置 Reilly et al.38 GEO: GSE63648
チンパンジー個別ゲノム Prado-Martinez et al.82 https://www.ncbi.nlm.nih.gov/sra?term=SRP018689
knownGene Navarro Gonzalez et al.83 https://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/
減数分裂組換えDSBホットスポット Pratto et al.47 GEO: GSE59836
生データと処理済みシーケンスリード この研究 GEO: GSE212159
組換え頻度マップ Zhou et al.51 ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/technical/working/20130507_omni_recombination_rates
参照ゲノム:hg38, panTro6, panPan2, gorGor5, gorGor6, ponAbe3 UCSC Genome Browser https://hgdownload.soe.ucsc.edu/downloads.html
レプリケーションタイミングデータセット Ding et al.49 https://www.thekorenlab.org/data
Ultraconserved Element の位置 Bejerano et al.45 https://hgwdev.gi.ucsc.edu/
Vindija Cave Neanderthal ゲノム Prüfer et al.84 https://www.eva.mpg.de/neandertal/draft-neandertal-genome/data.html
実験モデル 生物/系統
マウス C57BL/6J (B6) (WT) The Jackson Laboratory JAX: 000664
オリゴヌクレオチド
合成 STARR-seq インサート配列 本調査データ S1
ターゲットエンリッチメントプライマー 本研究データS1
リコンビナントDNA
hSTARR-seq ORI ベクター Addgene RRID: Addgene 99296
PGK-EGFP Addgene RRID: Addgene 169744
ソフトウェアとアルゴリズム
bcl2fastq2 変換ソフトウェア v2.20 Illumina https://support.illumina.com/downloads/bcl2fastq-conversion-software-v2-20.html
BWA 0.7.17 Li and Durbin85 https://github.com/lh3/bwa
CellRanger v6.0 10x Genomics https://support.10xgenomics.com/
ClustalW2 Larkin et al.,86 https://www.ebi.ac.uk/Tools/phylogeny/simplephylogeny/
gonomics Vertebrate Genetics Laboratory https://github.com/vertgenlab/gonomics
GraphPad Prism GraphPad https://www.graphpad.com/
GREAT バージョン 4.0.4 McLean et al.87 http://great.stanford.edu/public/html/
ImageJ Schindelin et al.88 https://imagej.net/software/fiji/
kentUtils Kent et al.89 https://github.com/ENCODE-DCC/kentUtils
lastz Harris90 https://github.com/lastz/lastz
multiz Blanchette et al.91 https://bio.tools/multiz
muscle Edgar92 https://www.ebi.ac.uk/Tools/msa/muscle/
phylotree Shank et al.93 https://phylotree.hyphy.org/
Plink Purcell et al.94 https://zzz.bwh.harvard.edu/plink/
R バージョン 4.0.5 R Foundation for Statistical Computing95 https://www.r-project.org/
RPHAST Hubisz et al.96 https://github.com/CshlSiepelLab/RPHAST
Seurat v4.0 Hao et al.97 https://satijalab.org/seurat/
SNPeff Cingolani et al.98 http://pcingola.github.io/SnpEff/
新しいタブで表を開く
リソースの有無
リード連絡先
リソースや試薬に関する詳細な情報やリクエストは、リードコンタクトであるCraig B. Lowe craig.lowe@duke.edu までお願いします。
試薬の入手方法
この研究では、新たな試薬は生成されませんでした。
実験モデルおよび被験者の詳細
E14.5 および E15.5 の野生型 B6 マウス胚を、方法の詳細に記載されているように、 scSTARR-seq および GFP エンハンサーレポーターアッセイの両方で子宮内エレクトロポーレーションに使用し た。胚は、子宮角の位置によって実験またはコントロール注入プラスミドに順次割り当てられた。scSTARR-seqまたはGFPエンハンサーレポーターアッセイを一方の性別の胚に限定しなかった。
すべての実験は、Duke University School of MedicineのDivision of Laboratory Animal ResourcesおよびDuke UniversityのInstitutional Animal Care and Use Committeeのガイドラインに準拠して行われた。
メソッドの詳細
ヒトの遺伝的変異の前処理
ヒトゲノムの高速進化領域の形成における選択の役割を解析するために、1000 Genomes Project26 によって集められた2,504のヒトサンプルのハプロタイプフェーズハイカバレッジ遺伝子型データに、url: https://www.internationalgenome.org/data-portal/data-collection/30x-grch38 からアクセスした。
この遺伝子型データは、選択解析に使用するために、一連の変換が行われた。まず、gonomics: vcfFilterを使用して、血縁関係のない個体の常染色体二重置換バリアントのみを保持しました。人間の移動によって生じた集団ボトルネックの影響を軽減するため、アフリカの集団(西部のガンビア人-マンディンカ、シエラレオネのメンデ、ナイジェリアのエサン、ナイジェリアのヨルバ、ケニアのウェブのルヒェ)からの個体のみを考慮した。gonomics: vcfAnestorAnnotation を実装し、ヒトの参照配列と推定されるヒト-チンパンジーの祖先配列とのペアワイズアラインメントを用いて各バリアントの祖先アリルを決定しました(下記の祖先状態推定を参照)。現存するヒト集団に存在する2つの対立遺伝子のうち1つが、推定された祖先の配列に存在する対立遺伝子と一致するため、祖先と由来の状態が明確に決定できる変種を保持しました。どちらの対立遺伝子も推定された祖先の配列と一致しない多型部位は削除した。フィルタリングとアノテーションを行った結果、501人の遺伝子型がコールされた合計29,739,731のバイアレリックサイト(サイトあたり合計1002のアレル)が保持された。
これらの変異体のうち、比較解析の対象となる領域と重なる部分集合を作成した。これらの関心領域は、6つのセットを含んでいる。HAQER、HAR、Ultraconserved Elements45 (UCE)、ミスセンスバリアント、ENCODE candidate cis-regulatory element、既知の遺伝子のエクソンと重複しないゲノム領域を含むランダムな中立プロキシ(RAND)83、hg38アセンブリのすべてのギャップなし塩基から疑似ランダムに選んだENCODE cCRE(gonomics:simulateBed、kentUtils:fatureBits)です。1000 Genomes Projectの501個体から、SnpEff.98を用いてミスセンスバリアントのセットを作成しました。連鎖不平衡の影響を抑えるため、gonomics:proximityBlockVcfを用いて、サンプルセット内の他のバリアントから最低1万塩基離れたバリアントを保持し、gonomics:vcfAfsを用いてバリアントデータから派生アレル頻度スペクトルを作成しました。
各集団について、3種類の派生アレル頻度(DAF)の割合を測定しました:高頻度派生アレル(DAF > 0.99)、低頻度派生アレル(DAF < 0.01)、希少マイナーアレル(DAF < 0.01 or DAF > 0.99)です。次に、各カテゴリーの濃縮度を、ランダム中立代理セット(RAND)で観察された割合に対する各カテゴリーで観察された対立遺伝子の割合として計算した。ある領域の対立遺伝子頻度のカテゴリーに対する濃縮度は、RANDと比較して、ボンフェローニで調整したMann-Whitney U検定により算出した(n = 5、5つのアフリカ集団に相当)。
ベイズモデル設計
HAQERに作用する選択圧の方向と大きさを推測するために、ヒト集団の対立遺伝子頻度データを用いて、高度に保存されたゲノム領域に作用する選択圧を推測するために開発された統計的枠組みに基づいて、階層的ベイズモデルを実行した34。
我々は、HAQERまたは他のゲノム領域のセット内のすべての塩基位置について、フィルタリングされたすべてのバリアントコール(ヒト遺伝的変異の前処理を参照)を、分離部位のセットに抽出した。我々は、分離部位を、その分離部位について遺伝子型コールを有する個々の対立遺伝子の数nk、およびk番目の分離部位において派生対立遺伝子を有する個体の数ikを含むタプル、Skとして定義する。
Sk={ik,nk}
ik/nkしたがって、派生対立遺伝子頻度、すなわち、その分離部位で派生対立遺伝子を持つ個体配列の割合を表す。さらに、Sを分離部位の集合として定義し、以後、派生対立遺伝子頻度スペクトルと呼ぶ。
S=(S1,S2,S3,...Sn)
対立遺伝子頻度スペクトルSの各分離部位には、選択係数sとハプロイド有効集団サイズNeの積の2倍である独自の選択パラメータαが付随していると仮定する。
α=2Nes
したがって、派生対立遺伝子頻度スペクトルSにおけるn個の分離部位のそれぞれに対応する選択パラメータの集合は、ベクトル量αによって表される。
α=(α1,α2,α3,...αn)
αの各αkは平均μ、標準偏差σの正規分布から独立に選択されると仮定し、個々の値αが選択される確率は関数f(α|μ,σ)に従うとする。したがって、μは変種の集合の平均選択パラメータを表す。中立的な選択を受けている領域はμ≈0を示し、μ < 0とμ > 0はそれぞれ負の選択と正の選択を示しているはずである。
また、量Θを定義して、次のようなパラメータのセットを表す。
Θ={α,μ,σ} とする。
ベイズ則を用いると、観測された対立遺伝子頻度スペクトルP(Θ|S)が与えられたときの特定のパラメータ集合の事後分布を以下の式で表すことができる。
P(Θ|S)=P(S|α)f(α|μ,σ)g(μ)h(σ)∫∫P(S|α)f(α|μ,σ)g(μ)h(σ)dαd μd σ
ここでP(S|α)は与えられたαに対する導出対立遺伝子頻度スペクトルSの尤度関数、f(α|μ, σ)は正規分布事前分布、g(μ)とh(σ)は超優先度、 h(σ) はガンマ分布のσ上超優先度でガンマ(2、10)、 g(μ) は正規分布のμ上超優先度で正規(0、3)、を表す。したがって、このモデルは、パラメータセットαの事前分布であるf(α|μ, σ)がハイパーパラメータμとσによって支配されるので、階層ベイズモデルであると言えるでしょう。
尤度の計算
Wright-Fisherモデルでは、派生対立遺伝子頻度pの定常分布は、特定の分離部位の選択パラメータであるαkの関数として、次の式で記述することができる:99
φ(p|αk)=1-e-αk(1-p)1-e-αk2p(1-p)
集団から有限個の対立遺伝子nkをサンプリングしたとき、真の派生対立遺伝子頻度はわからないが、特定の分離部位については、定常性密度と特定の離散対立遺伝子頻度ik/nkで分離部位を観測する二項密度の積をすべての可能な派生対立遺伝子頻度p34について積分した密度関数Fを定義することができる。
F(ik|nk,αk)=∫01nk!ik!(nk-ik)!pik(1-p)nk-ikφ(p|αk)dp
そして、特定の派生アレル頻度ikを観測する確率は、以下のように表すことができる。
P(ik|nk,αk)=F(ik|nk,αk)∑j=1nk-1F(j|nk,αk)
したがって、与えられた選択パラメータのセットαに対して、派生した対立遺伝子頻度スペクトルSを観測する尤度は、各分離部位の対立遺伝子頻度確率の積として表わすことができる。
P(S|α)=∏kP(ik|nk,αk)
選択パラメータのMCMC評価
マルコフ連鎖モンテカルロ法(MCMC)の一つであるメトロポリス・ヘイスティングス法を実装した gonomics: selectionMcmc で事後分布 P (Θ|S)を評価しました。
メトロポリス・ヘイスティングス・アルゴリズムは、パラメータの初期セットΘから始まり、現在のパラメータセットに基づいて新しいパラメータセットΘ′を描画する。この新しいパラメータ集合を描くために、σ′と呼ばれるσの新しい値は、まず正規分布Normal(σ, sigmaStep)からランダムな値として選択される。これにより、提案されたσ′が0未満であっても、h(σ)のサポート外であり、受理確率が0であると評価されることになる。次に、新しいμ(μ′)の値を正規分布Normal(μ,muStep)から引き、ここでmuStepはパラメータ空間の探索を制御する第2の調整パラメータであり、我々は0.5に設定した。シグマステップとミューステップを調整することで、受入確率が0.5付近になるようにした。α(α′)のプロポーザルは、Normal(μ′,σ′)から各αk′を抽出して生成した。
μとσの現在値のときにμ′とσ′を提案することは、μ′とσ′の現在値のときにμとσを提案することに等しいという提案関数の対称性により、候補パラメータセットΘ′の受容確率は、以下のように減少させることができる。
P(accept)=min{1,P(S|α′)P(S|α)*g(μ′)h(σ′)g(μ)h(σ)}となる。
新しいパラメータセットΘ′が受け入れられた場合、それは次の反復における初期パラメータセットとして機能する。多くの反復を経て、Θパラメータセットのランダムウォークは、その定常性分布がパラメータの事後分布を表すマルコフ連鎖を形成する。
各鎖の平均値と95%最高密度信頼区間を計算するために、gonomics: mcmcTraceStatsを実装し、進化的に関心のある領域と重なる変種セットについては、バーンインとして最初の5000回の反復を破棄しました。
Divergence-based ascertainment correction(ダイバージェンスに基づく確認補正
HAQER、および我々の解析における他のゲノム領域のセットは、ヒトの参照アセンブリと他の種との間の乖離のレベルに基づいて定義された。このことは、乖離の低い参照アセンブリの領域が、低い由来対立遺伝子頻度を持つ分離部位に富むという系統的なバイアスを生み出す。同様に、参照集合体の分岐度の高い領域は、派生アレル頻度の高い分離部位に富んでいる。これは、単一のヒト対立遺伝子(参照集合体)をサンプリングした場合、派生対立遺伝子頻度の低い分離部位は非発散に見え、派生対立遺伝子頻度の高い分離部位は、単一のヒト対立遺伝子をサンプリングした場合、発散に見える可能性が高くなるからである。この問題はKernによって広く研究されており35、彼はこの確認バイアスを修正するための数学的枠組みを記述している。このフレームワークを利用して、我々は尤度関数の修正版を導入する。この修正版は、一組の変種の乖離に基づく確認(Asc)を条件とするものである。
P(S|Asc,α)=∏kP(ik|nk,Asck,αk)
この補正尤度関数を計算するために、1つのヒト対立遺伝子(参照ゲノムからの対立遺伝子)のみが確認に使用されたKern補正の特別なケースを使用します。分離部位Sk={ik,nk}が2つのゲノム間で分岐していると同定される確率を次のように表現する。
P(Asck|ik,nk,αk)=iknk
ここで、nkは分離部位kの遺伝子型をコールした個体数を表し、対立遺伝子の追加観測として参照ゲノムを含む。逆に、分離部位を祖先の状態で確認する確率をその対立遺伝子頻度の関数で表すと
P(Asck|ik,nk,αk)=nk-iknk
ベイズの定理を用いると、補正後の対立遺伝子頻度確率式は次のように表される。
P(ik|nk,Asck,αk)=P(ik|nk,αk)P(Asck|ik,nk,αk)P(Asck|nk,αk)となる。
この式において、分母は一定の正規化係数を表す。
P(Asck|nk,αk)=∑j=1nk-1P(j|αk)P(Asck|j,nk,αk)
この補正を、gonomics: selectionMcmcプログラムのオプション -divergenceAscertainment と -includeRef を用いて、乖離に基づく基準(すなわち、HAQERs、HARs、UCEs)により生成した領域セットの各分離サイトに対して適用しました。
合成データセットによるMCMCの検証
MCMC選択モデルを検証するために、合成データを生成するために使用した既知の選択パラメータを回復するモデルの能力を評価した。そのため、特定の選択パラメータαに基づく合成対立遺伝子頻度スペクトルを生成するgonomics: simulateVcfを設計し、実装した。
対立遺伝子頻度スペクトルSを生成するために、パラメータ{ik, nk}を持つ個々の分離サイトSkを生成した。ある選択パラメータαに基づく分離サイトをシミュレートするために、プログラムはまずパラメータ5000∗ Beta(α = 0.001, β = 0.5)の分布からβ分布の確率変量p∈ (0, 1)を生成した。このパラメータはαが-10以上10以下の時の対立遺伝子頻度定常分布φ(p|α)の境界関数として機能するように選択した。記号的に言えば
[B(p)≥φ(p|α)]∀p∈(0,1),α∈[−10,10]
この関数が手に入れば、あとはB(p)からの変量を以下の確率で受け入れて、定常分布φ(p|α)からランダム変量を回収する有界棄却サンプリングができる。
Paccept=φ(p|α)B(p)
これは、与えられたαの値の下で進化している大きな集団の分離部位の集合に対して、合成された派生対立遺伝子頻度を生成する方法を提供する。
この方法を検証するためには、分離部位をこの母集団から有限のサンプルとして(ik, nk)の形で表現する必要がある。そのために、成功確率pkの二項分布からnk回のドローをシミュレートする。成功の回数はikとなる。ikが0またはnkに等しい場合(母集団で分離している部位がサンプルで分離していると検出されない場合を表す)、この結果は破棄され、新しいpkでプロセスが繰り返された。
選択パラメータαを5つの値(すなわち、-4、-2、∼0、2、4)に対して10個の独立した合成データセットを生成し、合計50個の合成由来対立遺伝子頻度スペクトルを生成した。α=0では定常分布が不定となるため、α=0.01で中立に近い選択(∼0)を表現することにした。代表的なスペクトルを図S1Aに示す。
合成データから選択パラメータを推定するために、各データセットに対して、中立に近い初期パラメータ図S1Bから始めて50,000回反復するMCMCサンプリングを実施した。最初の5,000回をバーンインとして破棄し、推定された選択パラメータの事後分布の平均値と95%信頼区間を図S1Cに表示した。各データセットの生成に使用した選択パラメータの真の値は、縦の破線で表示されています。
gonomics: simulateDivergentWindowsVcf プログラムを実装し、Kern 補正の特別なケースを使用して、合成派生アレル頻度データセットにおける分岐に基づく確認バイアスの補正能力を検証した35。各反復実験について、固定選択パラメータαで静態分布から生成した100個のシミュレーション分離サイトを含む1000セットの変異体を生成し、各セットで生成した分岐サイト数を計算し、分岐サイト数の順に上位1%または下位1%のセットを返した。選択パラメータαは、強い正の選択(α = 5)、強い負の選択(α = -5)、中立の期待(α = 0.01)の3つの値で、上下の分岐バリアントセットを10反復生成しました。
ゲノムワイドなマルチプルアライメント
ヒト、チンパンジー、ゴリラのゲノムにおいて、最も早く進化した領域を特定するために、以下のアセンブリを使用して、ゲノムワイドアラインメントを作成しました。ヒト(Homo sapiens, hg38)、チンパンジー(Pan troglodytes; panTro6)、ボノボ(Pan paniscus; panPan2)、ゴリラ(Gorilla gorilla, gorGor5)、オランウータン(Pongo abelii, ponAbe3)です。
UCSC Genome Browser100 から各参照アセンブリをダウンロードし、LASTZ でローカルのペアワイズアラインメントを作成しました。90 パラメータ(O=600 E=150 T=2 M=254 K=4500 L=4500 Y=15000)付きの human-chimp.v2 スコアリングマトリックスを使用しました。
連鎖の際にミスアラインメントを防止、除去するために、いくつかの追加ステップを踏みました。まず、アセンブリのギャップを埋める連鎖したアラインメントの生成を防ぐため、ゲノムの各ギャップレス領域のアラインメントを独立して連鎖し、ヒトゲノムでは1Mb以上、クエリーゲノムではそれぞれ20kb以上のギャップレス領域のみを考慮しました。このフィルタリングにより、オルソログとパラログをよりよく分離するために、大きなゲノムコンテキストを確保することができました。また、カスタムスコアリングマトリックス(O=20 E=5)を作成しました。
A C G T
A 3 -11 -8 -12
C -11 3 -11 -8
G -8 -11 3 -11
T -12 -8 -11 3
新しいタブで表を表示
とギャップペナルティ関数
tableSize 5
smallSize 11
位置 1 2 3 11 111
qGap 12 19 24 43 420
tGap 12 19 24 43 420
bothGap 25 40 50 90 700
新しいタブで表を開く
axtChainプログラムでは、ターゲットまたはクエリの大きなギャップにまたがるアラインメントの連鎖を防ぐことにより、より保守的にローカルアラインメントを連鎖させることができます。チェーンは最小スコア50,000になるようにフィルタリングし、kentUtils: chainNetを使用して、ヒトゲノムの各整列可能位置の最終的なペアワイズアラインメントを生成しました。
MultiZ91 を用いて複数種ゲノムワイドアラインメントを生成し、アラインメントされた FASTA ファイルに変換しました(gonomics: mafToFa)。このアラインメントのサブセクションは、gonomics: multFaVisualizerを使用して表示されました。
発散速度と加速度の解析
ヒトの枝のゲノム領域の速度と加速度を分析するために、ゲノムワイドアラインメントを4種に絞った。ヒト(Homo sapiens, hg38)、チンパンジー(Pan troglodytes, panTro6)、ゴリラ(Gorilla gorilla, gorGor5)、オランウータン(Pongo abelii, ponAbe3)の4種に絞り、500bpウィンドウでgonomics: multiFaAccelerationを用いてブランチ長を推定しました。
この方法は、系統樹の枝長を、2種の配列間のペアワイズ距離Dと、樹上のこれら2種を隔てるパトリックス距離dの二乗差を表す誤差項Qを最小化する枝長のセットとして推定し、枝長が非負になるように制約しています101,102。ある領域の枝長を計算するためには、すべての種がアライメントに存在する必要があるため、gonomics: mafToBedを実装し、そのようなすべての領域のBEDファイルを生成した。
Q=∑i∈S∑j∈S(Dij-dij)2
この木から得られた2つの枝の長さ、すなわち、ヒト・ゴリラ祖先とヒト・チンパンジー祖先の間の距離を表すb0と、ヒト・チンパンジー祖先と現存ヒトゲノム集合体の間の距離を表すb1が以降の計算で使用されます。そして、量vを速度スコア、すなわち分岐b1を超える分岐の速度を、進化100万年あたりの部位ごとの突然変異の単位で測定したものと定義した。ヒト-チンパンジーの祖先と現生人類との間の500塩基対の窓と740万年の進化を用いると、vは次のように計算される103。
v=b1500bp⋅7.4My
同様に、初速度スコアv0、すなわち分岐b0を越える分岐の速度を進化100万年あたりの部位ごとの差の単位で定義すると、次のようになる。
v0=b0500bp⋅2.3My
最後に、分岐b0とb1の間の速度の変化量として、加速度スコアという量aを定義する。
aα Δv=v-v0
ゲノム全体の平均的な速度スコアは、100万年の進化で1部位あたり9.18 - 10-4の差である。ヒトとHCAの間の進化が740万年、現生人類と現生チンパンジーの間の独立した進化が合計1480万年と推定すると、我々のモデルはヒトとチンパンジーの間の整列可能領域における平均配列分岐を1.36%と推定し、これは過去の推定と一致する36。
初速、速度、加速度の関係を計算するために、まず、290万個の500bpのゲノム窓を疑似ランダムにサンプリングしました(gonomics: bedFilter -subset)。次に、これらのゲノムウインドウを、速度と加速度のスコアの特定の範囲に対応するサブセットに分割した(gonomics: bedFilter -minNameFloat/maxNameFloat, gonomics: intervalOverlap)。
各加速度および速度のサブセットについて、これらのウィンドウで分離している二重鎖SNPを同定し、選択パラメータのMCMC評価で説明したように、速度または加速度の与えられた範囲に関連する平均選択パラメータを計算した。MCMCチェーンは10,000回繰り返し、最初の1,000回はバーンインとして廃棄された。これらの領域は乖離に基づいて同定されたので、すべての連鎖について乖離に基づく確認バイアスに対するKern補正を適用した。
500bpウィンドウの初速、速度、加速度の計算とともに、ゲノムセグメントの長さが可変である多様なゲノム領域セット(gonomics: branchLengthsMultiFaBed)についてもこれらのスコアを計算しています。非常に小さな要素で見られるこれらのスコアの大きな変動を防ぐために、50bpの長さを最小値として、ゲノム長lを変数としたより一般的な式を用いています。
v=b1l⋅7.2My
v0=b0l⋅2.3My
祖先の状態推定
ヒト、チンパンジー、ボノボ、ゴリラ、オランウータンゲノムのアラインメントから、最尤法104を用いて祖先の対立遺伝子状態を推定するために、gonomics: primateReconを実装しました。このプログラムを用いて、ヒト-チンパンジー祖先とヒト-ゴリラ祖先の両方を推定した。
まず、UCSC Genome BrowserのknownGenesトラックを遺伝子セットとして、コドンにおける4倍縮退部位に基づく中立進化速度を推定しました。PHAST: msa_view を用いて4回退化したコドン部位を抽出し、Jukes-Cantor model of evolution105を用いた最尤法96による固定トポロジー木の枝長を推定した(PHAST: phyloFit)。
塩基は、祖先ノードに接続された2つの独立した系統上の少なくとも2つの種に存在する場合、祖先ノードに存在すると判断された。祖先塩基が存在すると決定されたアラインメント列については、まず、4回縮退した部位から推定される木を用いて、祖先ノードにおけるA、C、G、Tの確率を再構築した104。次に、これらの4つの確率から祖先に1塩基を割り当てる2つの手法のうちの1つを用いた。これらの異なる祖先状態推論方法は、結果として推論された配列の特定の実験的使用ケースを反映している。最初の方法では、最も可能性の高い塩基を祖先として割り当てるために、他の3つの塩基の確率の合計が0.8以上でなければならないことを義務付けることによって、現存する種の塩基に向かって再構成を偏らせた。この方法は、現代種と祖先種の間の分岐部位を保守的に推定し、HAQER、チンパンジー-AQER、ゴリラ-AQERの確認に使用された。2つ目の祖先状態推定法は、現代人の分離部位に対する祖先対立遺伝子のアノテーションに使用した。この方法では、まずgonomics: vcfToFaを実装し、ヒト参照ゲノムのFASTA形式の配列を構築し、各分離部位の参照アリルをVCF形式のファイルから代替アリルに置き換えた。次に、ヒトとチンパンジーの祖先の4塩基の確率を計算し、その確率が99%以上であれば、最も可能性の高い対立遺伝子を祖先の状態として受け入れることにした。不確かな位置については、祖先の状態にNを割り当て、その後の派生対立遺伝子頻度の分析において、信頼度の高いSNPのみが保持されるようにした。
HAQERの同定
我々は、HAQER(Human Ancestor Quickly Evolved Regions)、すなわち、ヒト-チンパンジー祖先のヒトバイアスの推定と比較して、差異の密度が高いヒトゲノムの領域を同定した。
ヒト-チンパンジー祖先ゲノムの再構築をヒト基準ゲノム(hg38)に変換するために必要な進化操作(置換、挿入、欠失を含む)の回数を、500bpスライディングウィンドウごとに計算した(gonomics:faFindFast)。統計モデルが不確実な場合(最も可能性の高い塩基の確率が0.8未満の場合)、ヒト塩基の同一性を保守的に使用する我々のヒト・チンパンジー祖先の再構成を使用しました。この結果、我々が同定したヒト系統上の変化は、各ウィンドウで起こった進化操作の総数の下限である可能性が高く、高い信頼性を持つことになる。
HAQERに統計的有意性を付与するために、まず10Mbのウィンドウでゲノムをスキャンしてヌルモデルを構築し、チンパンジーとの分裂以来、ヒトゲノムの最も速く進化した10Mbセクションにおける突然変異の数を計算することにした。この信頼性の高いゲノム変化の割合は、1サイトあたり0.0126899回の進化操作であり、これをヌルモデルにおける分岐率μとして使用しています45,106。この分岐率を用いて、Rコマンドpbinom(N - 1, 500, μ, lower.tail = FALSE, log.p = FALSE)で500bpウィンドウ内でN個の変化を観察した場合の未訂正p値を算出することが可能です。N = 29のとき、我々の偽発見率は1.52096 - 10-7である。ヒト-チンパンジー間の再構築とヒト参照ゲノムを分離し、少なくとも29の進化操作を含む500bpの重複するウィンドウをすべてマージしました(gonomics: bedFilter, bedMerge)。この結果、最終的に1581個のHAQERのセットが得られた。
我々は、チンパンジーゲノム(chimp-AQERs)とゴリラゲノム(gorilla-AQERs)のそれぞれについて、偏った祖先推定を用いて、対応する最も速く進化した領域を特定するために、ほぼ同じ手順を実行した。チンパンジーのAQERは2497個、ゴリラのAQERは2885個同定された。HAQER、chimp-AQER、gorilla-AQER間の重複濃縮度をgonomics:overlapEnrichmentsで報告した。
HAQERのゲノム上の位置を可視化するためのideogramを作成するために、HAQERの座標のBEDファイルをUCSC Genome Graphs可視化ツールに対応したテキストファイルに変換し、それぞれの領域の振幅がその最大乖離密度に比例するようにした(gonomics: formatIdeogram)。ヒト・チンパンジー祖先とヒト参照ゲノム間の乖離密度を可視化するため、各500bpウィンドウの乖離をリスト化したBEDファイルをUCSC Genome Browser用のwiggle(WIG)フォーマットのトラックに変換した(gonomics: faFindFast, bedScoreToWig)。その後、このWIGトラックをバイナリwiggle(bigWig)形式のトラックに変換し、ブラウザ上で最終的に可視化した(kentUtils: wigToBigWig)。
染色体位置
染色体末端付近のHAQERの濃縮度を定量化するために、ヒト、チンパンジー、ゴリラのゲノムに擬似的にランダムに生成され均一に分布するゲノム要素を含むBEDファイルのセットを作成した(gonomics: simulateBed)。チンパンジーのAQERとゴリラのAQERはhg38座標上で同定されたため、kentUtils:liftOverを用いてこれらの領域をそれぞれpanTro6とgorGor6の座標上に投影し、それぞれの種に適したシンテニックコンテキストで染色体末端からの距離を計測した。次に、HAQERと擬似ランダム領域の両方について、染色体末端からの距離を計算し、染色体末端からの平均距離(t-検定)と染色体末端から5メガバズ以内の要素の割合(カイ二乗)を比較しました。
GREATオントロジー解析
Genomic Regions Enrichment of Annotations Tool87 (GREAT)を用いて、ヒト参照ゲノムhg38に持ち上げられたHAQERs、chimp-AQERs、gorilla-AQERs付近の濃縮Gene Ontology (GO) Biological Process遺伝子セットを同定することができた。ゲノム全体をバックグラウンド領域として、ボンフェローニで調整した二項対立のp値で有意な濃縮を報告する。
また、GREATを利用して、HAQERの3Dクロマチン接触部位近傍に濃縮されたGO Biological Processesを同定した。この目的のために、HiCARによってH1 hESCとGM12878細胞株で同定されたクロマチン接触部位にアクセスした81。次に、各細胞タイプにおいてHAQERと3次元クロマチン接触距離を形成するすべてのゲノム領域のセットgonomics:intervalContactsを同定した。各細胞株のすべてのクロマチン接触部位をバックグラウンド領域として、ボンフェローニで調整した超幾何学的p値で、有意な濃縮を報告する。
変異率および固定化率の推定
まず、hg38と推定されるヒト-チンパンジー祖先の間のすべての分岐位置のリストを作成した(gonomics: multiFaToVcf)。次に、HAQER、HAR、RAND、ENCODE、UCEなど、指定したゲノム領域と重なるすべての乖離部位のセットを作成した(gonomics: intervalOverlap. 次に、乖離部位の数を入力されたゲノム領域の塩基対の長さの合計で割った値を塩基あたりの乖離部位として算出した。同様に、塩基あたりの多型部位は、1000 Genomes Projectデータの501 African individualサブセット(Human genetic variation preprocessing参照)から、ゲノム領域の各セットに重なるバリアントの数をそのセットの塩基対での長さで割ったものとして計算した。
また、1000 Genomes Projectデータの501 African個体サブセットで同定された全多型部位のセット(gonomics: intervalOverlap)と分岐位置のセットを交差させた。両セットで見つかった位置を多型乖離部位、1000Genomes Dataで見つからなかった乖離部位を固定乖離部位とラベル付けをした。次に、各ゲノム領域のセットに重なる固定乖離部位と多型乖離部位のセットを決定しました(gonomics: intervalOverlap)。多型乖離部位の割合を多型乖離部位と固定乖離部位の合計で割った値をプロットし、RANDで観測された多型乖離部位の割合に対して独立性のカイ二乗検定により有意性を付与した。この分析のための2x2分割表は、領域の集合Xについて、{X, RAND}と{Fixed, Polymorphic}の次元を有していた。
組換えと複製のタイミング
目的の領域の組換え頻度を測定するために、1000 Genomes Project51でヨルバ族の全個体から推定したゲノム全体の組換えマップをHAQER、HAR、RANDと交叉させた。また,減数分裂二本鎖切断ホットスポットのBEDフォーマットファイル47 (GEO: GSE59836) にアクセスし,このデータセットとHAQERsを交差させた.オーバーラップの濃縮度は gonomics:overlapEnrichments で定量化し、交差する HAQER は gonomics:intervalOverlap で同定した。また、300のiPSCラインにおける複製タイミングのデータセット49にアクセスし、これらの300のiPSCラインにわたる各ゲノム領域の平均複製タイミングを表すデータセットを作成しました。このデータセットをhg38座標に変換し(kentUtils: liftOver)、HAQERs、HARs、RAND gonomics: intervalOverlapと交差させることで、HAQERs、HARs、RAND gonomicsを解析しました。
変異スペクトル解析
各ゲノム領域について、hg38と推定されるヒト・チンパンジー祖先の間のすべての乖離位置のセットを集め、このセットを6つの変異のクラス(A → G/T → C)(G → A/C → T)(A → T/T → A)(G → C → G)(A → C/T → G)(C → A/G → T)(gonomics: divergenceSpectrum) に分割した。次に、各ゲノム要素(A → G/T → C)または(A → C/T → G)に対して、弱い変異から強い変異であるHCA発散部位の比率を算出した。各ゲノム領域について、各値が各変異クラスにおける重複するHCA乖離部位の割合に関連する6つの値の行列を構築し、プログラミング言語Rの主成分分析を行った。
バックミューテーション解析
低頻度の派生型対立遺伝子(DAF<0.1)はほぼ前進変異(祖先対立遺伝子が派生型に変異する)のみであるが、高頻度の派生型対立遺伝子(DAF>0.9)は前進変異と後退変異(分岐後の派生対立遺伝子が祖先に変異する)の混合であると仮定している。前進突然変異は遷移と転移の確率が不均等である。前進突然変異の遷移の割合tfは、RANDの全分離部位における遷移の割合と等しくなるように推定した(tf = tseg = 0.685; gonomics: vcfInfo)。バックミューテーションもトランジションとトランスバージョンの確率が等しくならないように発生する。先祖の対立遺伝子が分離部位で相異するためには、バックミューテーションは先祖の対立遺伝子の状態に戻らなければならない。我々はtdivをRANDの全分岐部位における遷移の割合に等しいと定義する(tdiv = 0.668)。このモデルでは、遷移・転換の偏りが進化の過程で変化した場合に起こりうるように、tsegがtdivと異なることがある。しかし、我々のヒトの系統の分析では、tfとtdivは類似している。逆変異が起こりうるシナリオは2つある。第一に、乖離転移の逆転移がtf - tdivに比例した割合で起こることである。第二に、乖離型転移の逆転移は、乖離部位に対して2つの逆転移の可能性があるので、(1 -tf )(1 -tdiv)/2 に比例した割合で発生する。
したがって、逆変異の転移の期待される比率は次のようになる。
tb=tf⋅tdiv(1-tf)(1-tdiv)2+(tf⋅tdiv)
tfとtdivの推定値から、tb=0.897と推定される。つまり、バックミューテーションのある分離部位は、遷移の割合が定量的に上昇するはずである。
遷移の割合xを持つ分離部位の集合における前進変異と後退変異の相対的な割合を推定するために、次の混合モデルを使用する。
x=tff+tb(1-f)
ここで、fは前進変異の割合、(1-f)は後退変異の割合を表す。DAFが0.9以上のHAQERの分離部位は、遷移の割合xが0.75以上であると測定された。この図は、DAF > 0.9のHAQERにおける分離部位の約30%がバックミューテーションであることを意味する。
類人猿ゲノムの分岐解析
我々は、HAQERにおける分岐と制約のパターンを分析するために、30ウェイ全ゲノムマルチプルアラインメント91を構築した。このアラインメントには、hg38、panTro6、panPan2、ponAbe3、gorGor5の5つの参照ゲノムを含んでいる。これらの参照ゲノムに加えて、種内の個体から参照ベースのハプロイドアセンブリを作成し、種内の変異を調査した。このため、個体から得た短鎖シーケンスデータを対応する参照アセンブリにアラインメントし、各位置のコンセンサスアレルを算出した(gonomics: samConsensus)。
アルタイ山脈のDenisova洞窟から得られた30倍のカバレッジのDenisovanゲノム80、同じくアルタイ山脈のDenisova洞窟から得られた52倍のカバレッジのNeanderthalゲノム107、クロアチアのVindija洞窟から得られた30倍のカバレッジのNeanderthalゲノム84である。これらの古代のゲノムに加えて、1000 Genomes Projectからアクセスした、多様で無関係な10人のヒトのコンセンサス配列(HG00096, HG01112, HG03052, NA18525, NA20502, HG00419, HG01879, HG01500, HG03742, NA18939 )も含まれています。さらに以下の12匹のチンパンジー(各亜種から3匹のチンパンジー82)からのシーケンスデータも含まれています。Pan troglodytes verus (SRX243499, SRX243488, SRX243446), Pan troglodytes schweinfurthii (SRX237583, SRX237539, SRX237526), Pan troglodytes ellioti (SRX243519, SRX243518, SRX24351), Pan troglodytes trglodytes (SRX243489, SRX243492, SRX243496)です。
種内変動との関連で種間分岐を定量化するために、Dunn Index54を使用した。クラスタ内距離の最大値に対するクラスタ間配列距離の最小値の比として、一連の領域における各領域のDunn Indexを計算した(gonomics: dunnIndex)。Dunn Indexの解析は、少なくとも5つの分離部位があり、すべての個体がその領域に配列が揃っている領域に限定した。
クロマチン状態濃縮解析
クロマチン状態の濃縮と枯渇を解析するために、Roadmap Epigenomicsコンソーシアムの一部として作成された127のエピゲノムのChromHMM分類を使用した37。私たちは以前に説明した統計的枠組み109(gonomics: overlapEnrichments)を使用して、2セットのゲノム要素(セット1とセット2)間の重複濃縮と枯渇を計算しました。この手法の探索空間は、セット1とセット2の要素が見つかるゲノム内の領域と定義し、長さが1MBを超えるすべての非格納ゲノム領域を含みます。長さLのセット2の個々のゲノム要素が探索空間にランダムに分布しているとすると、セット1の要素と重なる確率は、セット1の要素と重なるサイズLの要素が探索空間に配置できる位置の数を、長さLの要素が配置できる探索空間の全位置数で割った値で表すことができる。n回の試行のうちk回重なる確率(nは集合2の要素数)はポアソン二項分布に従う.試行回数が多い場合,ポアソン二項分布は次の平均μ,分散σ2で正規分布に近似できる。
μ=∑i=1npi
σ2=∑i=1n(1-pi)pi
2つの要素のセット間の濃縮度を、観測された重複の数と重複の期待値であるμの間の比率として報告する。濃縮と枯渇のボンフェローニ調整p値を以下の式で計算する。
penrichment=min(1,2C・∑i=knNormal(μ,σ))
pdepletion=min(1,2C・∑i=0kNormal(μ,σ))
各ゲノムエレメントのペアについて、濃縮と枯渇の両方を検定したため、ボンフェローニ調整として、比較の数をCとした2Cを使用した。濃縮と枯渇の有意性はp<0.05で割り当てられた。
HAQERの二価クロマチン濃縮と環境応答の関係を調べるために、未処理のヒトA549細胞またはデキサメタゾン(dex)処理後の様々なタイムポイントのA549細胞から17のChromHMMデータセットにアクセスしました。これらのデータセットは、ENCODEコンソーシアムのウェブサイトから、以下のアクセッション番号でアクセスしました。encff107ywl, encff662ggj, encff161lgj, encff524gbp, encff877nzn, encff246ipy, encff146uil, encff113tcu, encff324pwa, encff255quq, encff052nxz, encff646ajn, encff108ted, encff910rii, encff845tim, Encff513ufq, Encff418whv. ここから、410個のdex反応性二価エンハンサーを、未処理細胞ではEnhBiv状態、処理後の任意のデータセットではEnhA1またはEnhA2状態であるゲノム領域として分類した。HAQER0547とHAQER0919の2つのHAQERは、dex応答性二価エンハンサーと重複していた(重複の予想値:0.32、p < 0.01, gonomics:overlapEnrichments )。
HAQERの機能アノテーション
HAQERとアカゲザルの分裂後に獲得した遺伝子制御要素との間の濃縮を同定するために、我々はRoadmap Epigenomics consortium37から、発達中の脳の参照エピゲノムE081とE082の活性エンハンサーと活性プロモーター状態(7 Enhと1 TssA)の15状態chromHmmデータをアクセスした。次に、BED形式のファイルをgonomics: bedMergeで連結・マージし、胎児脳参照エピゲノムで活性エンハンサーまたは活性プロモーターとして同定されたすべての領域を表すBEDファイルを作成しました。次にgonomics: intervalOverlapを用いて、アカゲザルの分裂後に獲得された遺伝子調節要素と重複するプロモーターとエンハンサー領域を同定した38。gonomics: overlapEnrichmentsを用いて、HAQERsとこれらの最近進化した調節要素間の濃縮度を計算した。
HAQERsとオープンクロマチンの間のオーバーラップを特定するために、ヒト胎児脳DHS-seqデータは、Roadmap Epigenomics Consortium data37から以下の3つの個体から取得した。GSM595920、GSM595922、およびGSM595926。hg19にアライメントしたBAM形式のアライメントファイルをsamtools:bam2fq110でFASTQ形式のシーケンスファイルに分解し、BWA MEMでhg38にアライメントした。85 DNase hypersensitivity sequencing (DHS-seq) データをUCSCゲノムブラウザで表示するために、 SAM/BAM 形式アライメントファイルからWIGグラフトラック形式へ変換する gonomics: samToWig を開発した。WIGファイルは、kentUtils: wigToBigWigでバイナリのbigWigファイルに変換されました。gonomics: bedValueWig を開発し、入力 BED ファイル中の各領域について、問い合わせた領域の座標範囲における入力 WIG ファイルの最高値に対応するスコアを生成した。1つの位置に少なくとも10本のリードが重なっている領域は、オープンクロマチンの可能性がある領域として、さらなる解析のために考慮されました。HAQERと他のゲノム領域とのオーバーラップは、アカゲザルの分裂後に獲得された機能要素38や、ヒトとチンパンジーの大脳オルガノイド39からのATAC-sequencing (Assay for Transposase-Accessible Chromatin using Sequencing) ピークの差分などを含み、gonomics: intervalOverlapを用いて決定された。
遺伝子合成とプラスミド調製
単細胞自己転写活性調節領域シーケンス(scSTARR-seq)用のテスト配列を合成し、商業サービス(Twist Bioscience)を用いてSTARR-seqスクリーニングベクター111にクローン化した。ショートリード3′RNAシーケンシングで近縁のオーソログ配列を区別するために、各インサートの3′末端に8塩基対のユニークバーコードを付加した。プラスミドをOne Shot Stbl3化学的コンピテント大腸菌(Thermo Fisher)に形質転換し、アンピシリン耐性について選択し、100μg/mLアンピシリンを含むルリアブロス(Invitrogen)中で増幅させた。その後、エンドトキシンを含まないプラスミドを、製造者の指示に従い、ZymoPURE II Plasmid Maxiprep kit(Zymo Research社製)を用いて精製した。必要に応じて、精製したプラスミドを3M Na-Acetate pH 5.2、100%エタノールで2時間沈殿させ、望ましい濃度を達成させた。in vivo STARR-seqのために、各STARR-seqプラスミドを含む等モル溶液を、総プラスミド濃度3μg/mLで調製した。このプールされたSTARR-seq溶液は、次に最終注入溶液の全プラスミド含量の1/6を占めるpCAG-GFP注入レポータープラスミドと混合された。インプットSTARR-seqライブラリーには、合計77の異なる挿入物を持つプラスミドが含まれていた。13のHAQER配列のオルソログに対応する60、図S5EおよびS5Fの解析にのみ使用した7つの配列、および陰性対照として機能した10の疑似ランダム配列(STAR Methods)であった。PGK-EGFPエンハンサーレポーターアッセイのために、我々はポリメラーゼ連鎖反応によってSTARR-seqプラスミドベクターからHAQER挿入物を増幅し、これらの挿入物をギブソンアセンブリクローニングによってPGK-EGFPプラスミドベクター (Addgene #169744) に導入し、サンガー配列決定によって確認した112。
子宮内エレクトロポレーション
E14.5 または E15.5 の野生型 B6 妊娠メスにイソフルランで麻酔をかけた。子宮角は腹部を切開して露出させた。各胚に1-1.5μlのプラスミド溶液(0.01%のファーストグリーンと1-2μg/μlのプラスミドを含む)を注入し、以下のパラメータを用いてエレクトロポレーションした:白金メッキBTXピンセット電極を用いて50V(E14.5)または60V(E15.5)で950msecパルス間隔で5回、パルスを照射した。その後、子宮角を腹腔内に再配置し、筋肉と皮膚の切開部を縫合した。その後、ダムを回復のために加熱パッドの上に置き、モニターした。
免疫蛍光染色と画像取得
脳は4% PFA-PBSで4◦Cで一晩固定し、PBSで洗浄後、30% sucrose-PBSで沈むまで浸漬した(24時間)。脳をNEG-50培地(Richard-Allan Scientific)で凍結し、クライオスタット切片(20μm)を作製し、使用時まで-80◦Cで保存した。切片をPBSで10分間3回洗浄し、1μg/mlのHoechst 33342(Invitrogen)を室温で30分間インキュベートした。次に、切片をマウント媒体としてVectashield(Vector Laboratories)を用いてマウントした。画像は、アポトーム2 と結合した Zeiss Axio Observer Z.1 顕微鏡で取得した。88 統計的有意性は、GraphPad Prismの2元配置ANOVAによって割り付けられた。各注入コンストラクトにつき2つのIUE(n=4)から得た2つの胚の切片から解剖学的に比較可能な領域を分析した。
蛍光活性化セルソーティング
エレクトロポレーションした脳を約18時間後に採取し、氷冷した滅菌PBS中で解剖した。髄膜を除去し、皮質のGFP+部分を0.1% DNAse I (New England Biolabs cat# M0303S)を添加した0.25%トリプシン-EDTA中で37℃、10分インキュベートした。インキュベーション後、トリプシン溶液を除去し、0.01% DNAse Iを添加した氷冷10% FBS/HBSS/Propidium iodide (Invitrogen) と交換した。その後、火で磨いたガラスピペットでトリチウム化して単一細胞サスペンションを作り、30μmセルストレーナーで濾過した。次に、細胞を製造者の指示に従い、LIVE/DEAD Near-IR Dead Cell Stainで染色した(Thermo Fisher)。染色後、FACS Aria II サイトメーター(BD Biosciences)を用いて、生存しているGFP+細胞をバルクソーティングした。
scSTARR-seqレポーターリードのターゲットエンリッチメント
内在性マウスmRNAとSTARR-seqレポーターRNAから生成したcDNAからレポーターリード配列を濃縮するために、Gasperiniらによって開発された10x標的濃縮プロトコルに基づく3段階PCR反応を行った114。約 10-13 ngの断片化していないscRNA-seq cDNAから始め、qPCRモニター50μl Phusion PCR(アニール温度62◦C、1.5μl DMSO)、以下のプライマーを用いて行った。
F1: tGFPOuter 5- ATGGCTAGCAAAGGAGAAGAACTCT -3
R1: R1-PCR1 5- acactctttccacacgacg -3
1x Agencourt AMPure XP ビーズクリーンアップ (Beckman Coulter) の後、クリーンアップした産物 2 μl を、続く 50 μl Phusion 反応 (12 サイクル) で以下のプライマーを用いて増幅させた。
F2: tGFPInner 5-GTCTCGTGGCTCGGAGATGTGTATAAGACAGCTTGTTGAATTAGATTGATCT -3
R2: RP5 5-AATGATACGCGACCGAGATCTACACTTTCCCTACGACG -3
1x AMPureクリーンアップ後、クリーンアップした生成物2μlを、以下のプライマーを用いて、3回目の50μl Phusion反応(12サイクル)に使用した。
F3: 5- CAAGCAGAAGACGGCATACGAGATIIIIIIIIGTCTCGTGGCTCG -3 (標準NEXTERA P7インデックス作成用プライマー)
R3: R2と同じ。
この反応後、ファイナルライブラリーを1X AMPureでもう一度洗浄し、Bioanalyzerで定量した。
scSTARR-seqシーケンスと前処理
10X Chromiumデバイスの1レーンあたり最大10,000個のGFP+細胞をキャプチャし、Chromium Next GEM Single Cell 3′ Reagent Kits v3.1 (Rev D) User Guide (10X Genomics, Inc.) のプロトコルを用いてシングルセルライブラリーを調製した。最終的なライブラリは、Bioanalyzer(Agilent)を用いて、メーカーのプロトコルにしたがって定量した。酵素的断片化の前に、cDNAのアリコートを分離し、標的濃縮を行った。NovaSeq 6000 S-Prime試薬(Illumina;R1 28、I1 10、I2 10、R2 90)を用いて最終10Xライブラリーを配列決定した。レポーター標的濃縮ライブラリーは、Illumina NextSeqプラットフォームで独立して配列決定した。両ライブラリーのFastqファイルは、bcl2fastq (v2.20.0.422, Illumina)を用いて回収した。標的濃縮ライブラリについては、以下の塩基マスクを使用した。Y28n*,n*,I8n*,Y75n*を使用。複数のレーンにわたるunenrichedライブラリとレポーターターゲット濃縮ライブラリの両方の出力fastqファイルを連結し、ダウンストリーム解析に使用した。
入力の正規化のために、NEBNext Ultra II FS DNA Library Prep Kit (New England Biolabs) を使用して、STARR-seq注入プラスミドライブラリーをシーケンスし、得られたライブラリーをIllumina iSeq 100プラットフォームでシーケンスした。入力ライブラリーからのFastqリードは、Burrows-Wheeler Aligner(BWA)を用いて、各STARR-seqレポーター構築物およびpCAG-GFP注入レポーターの配列を含む追加のFASTAレコードとマウス参照mm10の配列を含むカスタムSTARR-seq参照ゲノムにアライメントされた。n個のコンストラクトを有する入力STARR-seqライブラリーについて、個々のSTARR-seqコンストラクト、sの入力正規化因子Csは、次に、すべてのn個のコンストラクトが入力ライブラリー中に等モル濃度で存在する場合にsからの読み取りの予想数の、sからの読み取りの観察数に対する比として算出された。Cs=Es/Osここで
Es=(∑i=1nOi)/n
入力正規化係数が5より大きい(入力ライブラリ中の等モル濃度の5倍以上の枯渇を示す)構築物は、その後のすべての解析から除外された。
GFP+細胞は、エレクトロポレーションと解剖の解剖学的差異に関連するバッチ効果を制御するために、各実験のすべての胚からプールされた。E14.5で注入されたマウス6匹の胚からプールされたGFP+細胞からなる最初のライブラリから、3494個の単細胞を配列決定した。E15.5で注入した9個の胚のGFP+細胞からなる2番目のライブラリからは、3676個の単一細胞のトランスクリプトームが得られました。
エンハンサー活性の定量化
scSTARR-seqデータからエンハンサー活性をスコア化するために、gonomics: fastqFilter -collapseUmi を実行して、10xライブラリからユニーク分子識別子(UMI)の重複を削除しました。その後、gonomics: fastqFormat -singleCell を用いて、R1 のセルバーコードと UMI を解析し、R2 の fastq のリード名としました。その後、BWAを使用して、上記のカスタムSTARR-seq参照ゲノムにリードをアライメントした。各コンストラクトのエンハンサー活性スコアは、総レポーターUMI数1000あたりの入力正規化UMI数として計算された。STARR-seqプラスミドベクターからの転写の基底レベルを決定するために、gonomics: randSeqを用いて生成した500bpの疑似ランダムDNA配列を挿入したプラスミドを10個合成した。疑似ランダム配列に存在する偽エンハンサー活性を防ぐため、エンハンサー活性スコアが最も低い10個のネガティブコントロール構築物のうち6個を使用して、エンハンサー活性の検出限界を決定し、これをこれら6個の疑似ランダム配列からの平均エンハンサー活性スコアより3標準偏差上と定義した。各対象領域について、STARR-seqによるオーソログ(ヒト、ネアンデルタール、デニソワ、チンパンジー、HCA)テスト配列の作成を試みた。しかし、いくつかのオーソログペアは、目的の500bp領域で同じ配列を示した。重複するコンストラクトは統計解析に含めなかったが、図4Cにフェードバーとして表示されている。
単細胞クラスター同定と細胞型特異的エンハンサー活性の定量化
CellRanger v6.0 (10x Genomics) を用いて、上述のカスタムリファレンスゲノムを用いてカウントマトリックスを作成した。各ライブラリーについて、200以下の遺伝子または5,000以上の遺伝子を含む細胞を除去した。各ライブラリーは独立して正規化され、各ライブラリーについて2,000の高変量特徴が同定された。115 細胞周期関連遺伝子に基づく遺伝子発現の変動は、Seurat で提供された G2M および S 期関連遺伝子のアノテーションセットを用いたデータセットスケーリングにおけるクラスター分析から回帰された。各クラスタの上位10個の陽性マーカーを同定し、マウス62とヒトの既刊の神経発達単一細胞アトラスにおけるマーカー遺伝子発現に基づいて、クラスタの識別を手動で割り当てた60。
細胞種特異的なエンハンサー活性を定量するために、上記のカスタムSTARR-seqリファレンスゲノムにアライメントした各ライブラリーのリードを、gonomics: mergeSort -singleCellBxを用いて細胞バーコードでソートし、gonomics: scCountを用いて入力正規化カウント行列を作成した。入力正規化カウント行列は、Seuratによって各セルバーコードに対して決定されたクラスタIDを使用してメタクラスタによって分割された。4個未満のpCAG-GFP UMIを持つ細胞は廃棄された。各細胞の入力正規化されたレポーターUMIカウントは、次に、その細胞のpCAG-GFP UMIカウントにさらに正規化された。次に、細胞型エンハンサー活性スコアを、各クラスターの細胞あたりのトランスフェクション正規化、入力正規化UMIカウントの平均値として計算した。
エンハンサーパラログの系統解析
HAQER0059のhg38ヒト参照配列から始め、BLATで同定したヒト(hg38)、チンパンジー(panTro6)、ゴリラ(gorGor5)、オランウータン(ponAbe3)、アカゲザル(rheMac10)の集合体のすべてのパラログの配列を集めました68。ここから、すべての逆鎖配列に対して gonomics: faFormat -revComp を使用し、すべての順鎖のパラロガス配列を筋肉で整列させました。
GWASカタログ形質濃縮解析
26 原因となりうるバリアントの包括的なリストを作成するために、plink --r294 を使用して、各 GWAS カタログバリアントと連鎖不平衡(Plink R2 > 0.7)にある他のすべての 1000 Genomes Project バリアントを同定した。
次に、GWASカタログの関連表から、実験因子オントロジーからマッピングされた形質ごとに、すべてのGWASバリアントとリンクした変異のセットをマージし、このマージしたバリアントのセットとHAQERs gonomics間の重複濃縮を計算しました: overlapEnrichments. FDR調整p<0.05のマッピングされた形質について、有意な濃縮度を報告する。
また、HAQER、HAR、RANDに重複するすべての可能性のある原因バリアントについて、すべての原因バリアントの数(GWASバリアントとすべてのリンクしたバリアント(Plink R2 > 0.7)を含む)と各リンクしたバリアントの対応するGWASバリアントへの中央値の分布を算出した。
観察された疾患濃縮は、ハプロタイプ構造またはGWAS variant周辺の連鎖した変異の密度によってのみ影響されるとは考えにくく、これらの特徴はRANDとHAQER間で類似していた(図S6FおよびS6G)からである。
水平方向pleiotropyスコアの定量化
我々は、LD補正された水平方向の形質多面性スコア(Jordanらによって生成されたPnLD)で注釈された1,183,386個のヒト遺伝子変異のデータセットにアクセスした118)。これらのバリアントセットをHAQER、RAND、HARと交差させ、各ゲノム領域のセットと重なるバリアントにおけるPLDスコアの分布を比較した。
簡単に言うと、Jordanらは、遺伝的バリアントとヒト形質間のPheWAS関係を利用して、100の形質のセットにおいて、与えられたバリアントが関連する統計的に独立した形質の数の期待値としてPnLDを計算した。この方法は、各遺伝的変異とヒトの形質との関連性を示すZスコアの行列Zrawから始まります。多くの臨床形質は、部分的に冗長な用語や曖昧な用語(例:アルツハイマー病と認知症)、あるいは垂直多相性(例:高血圧と心臓病の間の因果関係)の結果として、共分散を示すことが分かっています。そこで、PnLDではZrawに以下のマハラノビス白色化変換を施すことで、形質間の共分散を補正しています。
Z=Σ-12Zraw
ここで、ΣはZrawの共分散行列である。この変換の結果は、結果として得られる行列Zの共分散行列が恒等行列に等しくなり、形質間の共分散がないことを示すことである。次に、変種nのPnは、変種nと有意に関連する白化形質の縮約数として計算される。
Pn=100l∑i=11H(zi-2)
ここで、H(zi-2)は、Heavisideステップ関数で、|zi| > 2のとき1に等しく、それ以外は0である。100/lの項は、有意に関連する白化形質の数を形質lの数と定数100でスケーリングし、結果として得られる項が、100の形質のデータセットにおける有意に関連する白化形質の数の期待値を示すようにする。最後に、この値を以下の変換により連鎖不平衡を補正する。
PnLD=Pn-βnx
ここで、xは変異位置のLDスコア、βnはPnのLDの回帰係数である。
定量化および統計解析
統計パラメータは、個々の図または対応する図の説明文のいずれかで報告された。実験の統計的な詳細は、メソッドの詳細に記載されている。すべての統計解析はRまたはGoで行った。
その他のリソース
生データおよび解析結果は、当社のウェブサイト(https://vertgenlab.org/)で公開されています。
データおよびコードの入手方法
この原稿のために書かれたすべてのソフトウェアは、Goプログラミング言語(golang)でオープンソースゲノミクスプラットフォームを開発するための進行中の取り組みであるGonomicsの一部として実装されました。Gonomics は https://github.com/vertgenlab/gonomics からアクセスできる。
ブラウザーのトラック、シーケンスファイル、マルチプルアラインメント、選択解析に使用したバリアントセットなどの生データおよび解析済みデータは、研究室のウェブサイト(https://www.vertgenlab.org/)で自由に入手できるようになりました。また、生データと解析済みデータはGEOに寄託されており、発表日現在、主要リソース表に記載されているアクセッション番号で公開されている。
この論文で報告されたデータの再解析に必要な追加情報は、要求に応じてリードコンタクトから入手可能である。
謝辞
Duke Human Vaccine Institute Research Flow Cytometry and Viral Genome Analysis core facilitiesに感謝する。Shataakshi DubeとScott Soderlingは、pCAG-GFPプラスミドを快く提供してくれた。Douglas A. Marchuk, Christiana Fauci, Chelsea R. Shoben, Seth Weaver, Shae Simpson, and Yanting Luoから批判的なフィードバックを得たことに感謝する。本研究は、Duke Whitehead Scholarship、National Human Genome Research Institute(R35HG011332)、Sigma Xi Grants in Aid of Research Program、North Carolina Biotechnology Center(2016-IDG-1013および2020-IIG-2109)、およびTriangle Center for Evolutionary Medicineによる支援を受けている。
著者による貢献
R.J.M.とC.B.L.は研究を考案し、論文を執筆した。R.J.M.、F.C.A.、F.M.、J.E.S.-F、D.A.S、E.H.A、J.C、L.S、および G.D.J. は実験と解析にあたった。T.E.R.、D.L.S.、C.B.L.は研究の監修と資金援助を行った。投稿前に全著者が原稿を確認し、編集し、承認した。
利害関係者の宣言
著者らは、競合する利害関係を宣言しない。
補足情報
.xlsxのダウンロード (.21 MB)
xlsxファイルに関するヘルプ
データS1
HAQERのゲノム上の位置と交差点、scSTARR-seqテスト配列、カスタムオリゴヌクレオチド配列、STARR-seqコンストラクト配列、図1および図4関連
参考文献
Sockol M.D.
ライクレンD.A.
ポンツァー H.
チンパンジーの運動エネルギーとヒトの二足歩行の起源(Chimpanzee locomotor energetics and the origin of human bipedalism.
Proc. Natl.Acad。Sci.USA。2007; 104: 12265-12269
https://doi.org/10.1073/pnas.0703267104
記事で見る
スコープス (222)
パブコメ
クロスリファレンス
グーグル奨学生
ビック S.J.
ウォーラーB.M.
パーL.A.
スミス・パスカリーニ・M.C.
バード・K.A.
FACSを用いたヒトとチンパンジーの顔面形態と動作の異種間比較。
J. Nonverbal Behav. 2007; 31: 1-20
https://doi.org/10.1007/s10919-006-0017-z
記事で見る
スコープス (124)
PubMed
クロスリファレンス
グーグル奨学生
ゲシュウィンド D.H.
ラキッチP.
皮質の進化:そのカバーで脳を判断する。
Neuron. 2013; 80: 633-647
https://doi.org/10.1016/j.neuron.2013.10.045
記事で見る
スコープス (328)
パブコメ
概要
全文
全文PDF
Google Scholar
シルバーD.L.
ゲノム分岐と脳の進化:制御DNAが大脳皮質の発達にどのように影響するか。
Bioessays. 2016; 38: 162-171
https://doi.org/10.1002/bies.201500108
記事で見る
スコープス (29)
PubMed
クロスリファレンス
グーグル奨学生
リチャード D.
リュー Z.
Cao J.
キアプール A.M.
ウィレン J.
ヤルラガッダ S.
ジャゴダ E.
コラチャラマV.B.
シーカー J.T.
チャン・G.H.
他
ヒト膝関節軟骨細胞制御の進化的選択と制約が変形性関節症リスクに影響を与える。
Cell. 2020; 181 (362.e28-381.e28)
https://doi.org/10.1016/j.cell.2020.02.057
記事で見る
スコープス (30)
パブコメ
概要
全文
全文PDF
Google Scholar
Xu K.
シャットE.E.
ポラード K.S.
ルソスP.
Dudley J.T.
ヒトの進化促進領域における統合失調症遺伝的変異のゲノムおよびネットワークパターン。
Mol. Biol. Evol. 2015; 32: 1148-1160
https://doi.org/10.1093/molbev/msv031
記事で見る
スコープス (63)
PubMed
Crossref
グーグル奨学生
クラーク A.G.
グラノフスキーS.
ニールセンR.
トーマス・P.D.
ケジャリワルA.
トッドM.A.
タネンバウムD.M.
チベッロD.
ルー F.
マーフィーB.
他。
ヒト-チンパンジー-マウスのオルソログ遺伝子トリオから非中立的進化を推測する。
サイエンス。2003; 302: 1960-1963
https://doi.org/10.1126/science.1088821
記事で見る
スクープ(511)
PubMed
クロスリファレンス
グーグル奨学生
ニールセン R.
ブスタマンテC.
クラーク A.G.
グラノフスキーS.
サックトン T.B.
フビッシュ M.J.
フレデルアロンA.
タネンバウムD.M.
チベッロD.
ホワイトT.J.
他
ヒトとチンパンジーのゲノムにおける正選択遺伝子のスキャン。
PLoS Biol.
https://doi.org/10.1371/journal.pbio.0030170
記事で見る
スコープス (693)
PubMed
クロスリファレンス
グーグル奨学生
フロリオ M.
ハイデM.
ピンソンA.
ブランドル H.
アルベルトM.
ウィンクラーS.
ヴィンベルガーP.
ハットナーW.B.
ヒラー M.
胎児新皮質の前駆細胞で優先的に発現するヒト特異的遺伝子の進化と細胞型特異性。
eLife. 2018; 7: e32332
https://doi.org/10.7554/eLife.32332
記事で見る
スコープス (91)
PubMed
クロスリファレンス
グーグル奨学生
フィデス I.T.
ロデウィックG.A.
ムーイングM.
ボスワース C.M.
ユーイング A.D.
マンタラス G.L.
ノバック A.M.
ヴァン・デン・バウトA.
ビシャラ A.
ローゼンクランツJ.L.
他
ヒト特異的NOTCH2NL遺伝子は、Notchシグナルと大脳皮質の神経発生に影響を与える。
Cell. 2018; 173 (1356.e22-1369.e22)
https://doi.org/10.1016/j.cell.2018.03.051
記事で見る
スコープス(230)
PubMed
アブストラクト
全文
全文PDF
Google Scholar
ハイデ M.
ハフナーC.
村山晃一
黒滝裕子
篠原秀夫
岡野秀行
佐々木英一
ハットナー W.B.
ヒト特異的ARHGAP11Bはマーモセット胎児の霊長類新皮質の大きさと折り畳みを増加させる。
サイエンス. 2020; 369: 546-550
https://doi.org/10.1126/science.abb2401
記事で見る
Scopus (63)
PubMed
クロスリファレンス
グーグル奨学生
キング M.C.
ウィルソンA.C.
ヒトとチンパンジーの2つのレベルでの進化。
サイエンス。1975; 188: 107-116
https://doi.org/10.1126/science.1090005
記事で見る
スコープス (1879)
PubMed
クロスリファレンス
グーグル奨学生
レイ・G.A.
シス制御変異の進化的意義。
Nat. Rev. Genet. 2007; 8: 206-216
https://doi.org/10.1038/nrg2063
記事で見る
スコープス (1028)
PubMed
クロスリファレンス
グーグル奨学生
キャロル S.B.
Evo-devoと拡大する進化合成:形態進化の遺伝学的理論。
Cell. 2008; 134: 25-36
https://doi.org/10.1016/j.cell.2008.06.030
記事で見る
スコープス (1280)
パブコメ
概要
全文
全文PDF
Google Scholar
ポラード K.S.
サラマS.R.
キングB.
カーンA.D.
ドレッツァーT.
カッツマンS.
シーペル A.
ペダーセン J.S.
ベジェラーノG.
バートシュR.
他
ヒトゲノムで最も速く進化する領域を形成する力。
PLoS Genet. 2006; 2: e168
https://doi.org/10.1371/journal.pgen.0020168
記事で見る
スコープス (310)
PubMed
クロスリファレンス
グーグル奨学生
バード・C.P.
ストレンジャーB.E.
リウ・エム
トーマス D.J.
イングル C.E.
ビーズリーC.
ミラー W.
ハーレスM.E.
ダーミッツァキス E.T.
ヒトゲノムにおける進化の早い非コード配列。
ゲノムバイオロジー 2007; 8: R118
https://doi.org/10.1186/gb-2007-8-6-r118
記事で見る
スコープス (112)
PubMed
クロスリファレンス
グーグル奨学生
リンドブラッド-トーK.
ガーバーM.
ズック O.
リン M.F.
パーカー B.J.
ワシエットル S.
ケラドプールP.
エルンスト J.
ジョーダン G.
マウセリ E.
他
29種の哺乳類を用いたヒトの進化的制約の高解像度マップ。
Nature. 2011; 478: 476-482
https://doi.org/10.1038/nature10530
記事で見る
スコープス (742)
パブコメ
クロスリファレンス
グーグル奨学生
プラバカー S.
ヌーナンJ.P.
パエボS.
ルービン E.M.
ヒトにおける保存された非コード配列の加速度的進化。
サイエンス。2006; 314: 786
https://doi.org/10.1126/science.1130738
記事で見る
スコープス (292)
パブコメ
クロスリファレンス
グーグル奨学生
ギッテルマンR.M.
フンE.
アイ F.
マデオイ J.
ペナッキオ・L.
ノーブル W.S.
ホーキンス R.D.
アキー J.M.
ヒト加速制御DNAの包括的な同定と解析。
ゲノム・リサーチ(Genome Res.) 2015; 25: 1245-1255
https://doi.org/10.1101/gr.192591.115
記事で見る
スコープス (56)
PubMed
Crossref
グーグル奨学生
カプラ J.A.
アーウィンG.D.
マッキンゼーG.
ルーベンスタインJ.L.
ポラード K.S.
ヒトの加速度領域の多くは発生エンハンサーである。
Philos. トランス。R.Soc.Lond。B Biol. Sci. 2013; 368: 20130025
https://doi.org/10.1098/rstb.2013.0025
記事で見る
スコープス (116)
パブコメ
クロスリファレンス
グーグル奨学生
ギルスキスK.M.
ステルガチスA.B.
デジェンナーロE.M.
ドアンR.N.
チアン X.
ジョンソン・M.B.
ワン・P.P.
セジョーン G.M.
ナギー M.A.
ポリーナE.A.
他
ヒト加速領域によるヒト神経発達遺伝子制御プログラムのリワイヤリング。
Neuron. 2021; 109 (3239.e7-3251.e7)
https://doi.org/10.1016/j.neuron.2021.08.005
記事で見る
スコープス (13)
パブコメ
概要
全文
全文PDF
Google Scholar
ボイド J.L.
スコーブ S.L.
ルアネJ.P.
ピラズL.-J.
ベプラーT.
ゴードン・R.
レイ・G.A.
シルバー D.L.
ヒトとチンパンジーのFZD8エンハンサーの違いは、発達中の大脳新皮質における細胞周期ダイナミクスを変化させる。
Curr. Biol. 2015; 25: 772-779
https://doi.org/10.1016/j.cub.2015.01.041
記事で見る
スコープス (149)
パブコメ
概要
全文
全文PDF
Google Scholar
ドアン R.N.
ベー・ベーアイ
Cubelos B.
チャン C.
ホセイン A.A.
アル・サード S.
Mukaddes N.M.
オナーO.
アルサファルM.
バルキーS.
他
ヒトの加速度領域における突然変異は、認知および社会的行動を破壊する。
Cell. 2016; 167 (341.e12-354.e12)
https://doi.org/10.1016/j.cell.2016.08.071
記事で見る
スコープス(133)
パブコメ
概要
全文
全文PDF
Google Scholar
ダンハム I.
クンダジェA.
オルドレッド S.F.
コリンズ P.J.
デイビス C.A.
ドイル F.
エプスタインC.B.
フリエッツェ S.
ハローJ.
Kaul R.
ヒトゲノムの DNA エレメントの統合百科事典。
Nature. 2012; 489: 57-74
https://doi.org/10.1038/nature11247
記事で見る
スコープス (10826)
パブコメ
クロスリファレンス
グーグル奨学生
ムーアJ.E.
パーカロM.J.
プラットH.E.
エプスタインC.B.
ショレッシュ・N.
エイドリアン J.
カワリ T.
デイビスC.A.
ドビンA.
他
ENCODEプロジェクト・コンソーシアム
ヒトおよびマウスゲノムのDNA要素の拡張百科事典。
Nature. 2020; 583: 699-710
https://doi.org/10.1038/s41586-020-2493-4
記事で見る
スコープス (435)
PubMed
クロスリファレンス
グーグル奨学生
ビルスカ-ビショップM.
エバニ U.S.
Zhao X.
バジーレA.O.
アベル H.J.
レギアA.A.
コルヴェロ A.
クラーク・W.E.
ムスヌリ R.
ナグラパリK.
他。
1000ゲノムプロジェクトの拡大コホート(602名のトリオを含む)におけるハイカバレッジ全ゲノムシークエンス
Cell. 2022; 185 (3426.e19-3440.e19)
https://doi.org/10.1016/j.cell.2022.08.004
記事で見る
Scopus (9)
パブコメ
概要
全文
全文PDF
Google Scholar
アーノルド C.D.
ゲルラッハD.
Stelzer C.
Boryń Ł.M.
ラートM.
Stark A.
STARR-seqで同定したゲノムワイド定量エンハンサー活性マップ。
Science. 2013; 339: 1074-1077
https://doi.org/10.1126/science.1232542
記事で見る
スコープス (555)
パブコメ
クロスリファレンス
グーグル奨学生
シェン S.Q.
マイヤーズC.A.
ヒューズA.E.O.
バーンL.C.
フラナリーJ.G.
コルボ J.C.
哺乳類中枢神経系における超並列シス制御解析。
ゲノム・レズ 2016; 26: 238-255
https://doi.org/10.1101/gr.193789.115
記事で見る
スコープス(65)
PubMed
クロスリファレンス
グーグル奨学生
ジョンソンG.D.
バレラA.
マクダウェルI.C.
ディポリットA.M.
マジョロスW.H.
ボックリーC.M.
ワン・X.
アレン A.S.
レディ T.E.
薬物応答性調節活性のヒトゲノムワイド測定。
Nat. Commun. 2018; 9: 5317
https://doi.org/10.1038/s41467-018-07607-x
記事で見る
スコープス (13)
パブコメ
クロスリファレンス
グーグル奨学生
クラインJ.C.
アガルワルV.
井上文雄
キースA.
マーティン B.
キルヒャー M.
アヒトゥブ N.
Shendure J.
超並列レポーターアッセイのデザインおよびコンテキスト依存性の系統的評価。
Nat. Methods. 2020; 17: 1083-1091
https://doi.org/10.1038/s41592-020-0965-y
記事で見る
スコープス (31)
PubMed
クロスリファレンス
グーグル奨学生
エレグレンH.
スミスN.G.
ウェブスター M.T.
哺乳類ゲノムの変異率変動。
Curr. Opin. Genet. Dev. 2003; 13: 562-568
https://doi.org/10.1016/j.gde.2003.10.008
記事で見る
スコープス (111)
PubMed
クロスリファレンス
グーグル奨学生
木村光太郎
分子進化の中立的理論.
ケンブリッジ大学出版局, 1983
論文で見る
クロスリファレンス
Google Scholar
ポラード K.S.
サラマ S.R.
ランバートN.
ランボットM.-A.
コペンス S.
ペダーセン J.S.
カッツマンS.
キング B.
オノデラ C.
シーペル A.
他
大脳皮質の発生過程で発現するRNA遺伝子が、ヒトで急速に進化した。
Nature. 2006; 443: 167-172
https://doi.org/10.1038/nature05113
記事で見る
スコープス (693)
パブコメ
クロスリファレンス
グーグル奨学生
カッツマン S.
カーンA.D.
ベジェラーノG.
フューエル・G.
フルトンL.
ウィルソンR.K.
サラマ S.R.
Haussler D.
ヒトゲノム超保存要素は超選択的である。
サイエンス。2007; 317: 915
https://doi.org/10.1126/science.1142430
記事で見る
スコープス (196)
PubMed
クロスリファレンス
グーグル奨学生
カーン A.D.
ダイバージェンスに基づく確認のための部位頻度スペクトルの補正。
PLoS One. 2009; 4: e5152
https://doi.org/10.1371/journal.pone.0005152
記事で見る
スコープス (9)
PubMed
クロスリファレンス
グーグル奨学生
チンパンジー配列決定・解析コンソーシアム
チンパンジーのゲノムの初期配列とヒトゲノムとの比較。
Nature. 2005; 437: 69-87
https://doi.org/10.1038/nature04072
記事で見る
Scopus (1727)
PubMed
クロスリファレンス
グーグル奨学生
クンダイエ A.
メウレマンW.
エルンスト J.
ビレンキー M.
イェン A.
ヘラヴィ-ムサヴィ A.
ケラドプール P.
チャン Z.
Wang J.
他。
111の基準ヒトエピゲノムの統合的解析。
ネイチャー. 2015; 518: 317-330
https://doi.org/10.1038/nature14248
記事で見る
スコープス (3506)
PubMed
クロスリファレンス
グーグル奨学生
レイリー・S.K.
Yin J.
アユーブA.E.
エメラ D.
レング J.
コトニー J.
サロ R.
ラキッチP.
ヌーナン J.P.
進化ゲノミクス。ヒト大脳皮質形成過程におけるプロモーターおよびエンハンサー活性の進化的変化。
サイエンス. 2015; 347: 1155-1159
https://doi.org/10.1126/science.1260943
記事で見る
スコープス (144)
PubMed
クロスリファレンス
グーグル奨学生
カントン S.
ボイルM.J.
ヘー Z.
サンテル M.
ワイガート A.
サンチス-カレハ F.
ギハロP.
シドー L.
フレック J.S.
ハンD.
他
オルガノイド単細胞ゲノムアトラスにより、脳の発達におけるヒト特有の特徴が明らかになった。
ネイチャー. 2019; 574: 418-422
https://doi.org/10.1038/s41586-019-1654-9
記事で見る
スコープス(248)
パブコメ
クロスリファレンス
グーグル奨学生
ギリラジャン S.
デニスM.Y.
ベーカーC.
マリグ M.
コーB.P.
キャンベル C.D.
マーク K.
ヴー T.H.
アルカン C.
チェン Z.
他。
自閉症スペクトラム障害に関連するコピー数変異の新しいホットスポットの精製と発見。
Am. J. Hum. Genet. 2013; 92: 221-237
https://doi.org/10.1016/j.ajhg.2012.12.016
記事で見る
スコープス (217)
パブコメ
概要
全文
全文PDF
Google Scholar
パウリッティ A.
アンドレウッツィE.
Bizzotto D.
Pellicani R.
タルティッキオG.
マラストーニ S.
パストレッロ C.
ユリシカ I.
リグレスティ G.
ブッチオッティF.
他
Matricellular protein EMILIN2の切除は、EGFR依存性のIL-8産生の障害による血管形成の欠陥を引き起こし、腫瘍増殖に影響を与える。
Oncogene. 2018; 37: 3399-3414
https://doi.org/10.1038/s41388-017-0107-x
記事で見る
スコープス(33)
PubMed
クロスレフ
グーグル奨学生
渡辺淳一
中町隆史
松野玲子
林大介
中村真一
菊山 悟
中條慎一郎
塩田 悟
下垂体アデニル酸シクラーゼ活性化ポリペプチドの脳発達における局在、特性および機能。
Peptides. 2007; 28: 1713-1719
https://doi.org/10.1016/j.peptides.2007.06.029
記事で見る
スコープス (54)
PubMed
クロスリファレンス
グーグル奨学生
王 喆喆
Qian Y.P.
Yang S.
Shi H.
Liao C.H.
Zheng H.K.
Wang J.
リン A.A.
カヴァリ-スフォルツァL.L.
アンダーヒルP.A.
他
下垂体アデニル酸シクラーゼ活性化ポリペプチド前駆体遺伝子の加速度的進化 ヒト起源時。
Genetics. 2005; 170: 801-806
https://doi.org/10.1534/genetics.105.040527
記事で見る
スコープス (25)
パブコメ
クロスリファレンス
グーグル奨学生
レスラーK.J.
マーサーK.B.
ブラッドリーB.
ヨバノビッチ T.
マハン A.
カーリー K.
ノールホルム S.D.
キラール V.
スミス A.K.
マイヤーズ A.J.
他
心的外傷後ストレス障害は、PACAPとPAC1受容体に関連している。
Nature. 2011; 470: 492-497
https://doi.org/10.1038/nature09856
記事で見る
スコープス (575)
パブコメ
クロスリファレンス
グーグル奨学生
ベヘラーノG.
キジM.
マクニンI.
スティーブン S.
ケント W.J.
マティック J.S.
Haussler D.
ヒトゲノムにおける超保存要素。
Science. 2004; 304: 1321-1325
https://doi.org/10.1126/science.1098119
記事で見る
スコープス (1235)
PubMed
クロスリファレンス
グーグル奨学生
ブラウンC.A.
マレーA.W.
Verstrepen K.J.
酵母におけるサブテロメア遺伝子ファミリーの急速な拡大と機能的分岐。
Curr. Biol. 2010; 20: 895-903
https://doi.org/10.1016/j.cub.2010.04.027
記事で見る
スコープス (213)
パブコメ
概要
全文
全文PDF
Google Scholar
プラット F.
ブリック K.
キルP.
スマグローヴァF.
ペトゥコヴァG.V.
カメリーニ・オテロR.D.
DNA組換え。個々のヒトゲノムの組換え開始マップ。
サイエンス. 2014; 346: 1256442
https://doi.org/10.1126/science.1256442
記事で見る
スコープス (0)
パブコメ
クロスリファレンス
グーグル奨学生
アーバイトゥバーB.
ベタンコートA.J.
エブナーT.
ティーマン-ベージュI.
クロスオーバーは組換えホットスポットでの突然変異と偏った遺伝子変換に関連している。
Proc. Natl. Acad. Sci. USA. 2015; 112: 2109-2114
https://doi.org/10.1073/pnas.1416622112
記事で見る
スコープス (118)
PubMed
クロスリファレンス
グーグル奨学生
丁 琪
エドワーズ M.M.
Wang N.
Zhu X.
ブラッチ A.N.
ハルケM.L.
フー Y.
トン・Y.
シャオ・ジェイ(Hsiao J.
シャルベC.J.
他
ヒト多能性幹細胞におけるDNA複製タイミングの遺伝的構造。
Nat. Commun. 2021; 12: 6746
https://doi.org/10.1038/s41467-021-27115-9
記事で見る
スコープス (6)
PubMed
クロスリファレンス
グーグル奨学生
ジェンセン・シーマン M.I.
フューリーT.S.
ペイザーB.A.
ルー Y.
ロスキン K.M.
チェン C.F.
トーマス・M.A.
ハウッスラーD.
ジェイコブ H.J.
ラット、マウス、ヒトのゲノムにおける組換え率の比較。
ゲノム研究 2004; 14: 528-538
https://doi.org/10.1101/gr.1970304
記事で見る
スコープス (359)
PubMed
クロスリファレンス
グーグル奨学生
周 毅
ブラウニングB.L.
ブラウニングS.R.
子孫の同一性セグメントからの集団特異的な組換えマップ。
Am. J. Hum. Genet. 2020; 107: 137-148
https://doi.org/10.1016/j.ajhg.2020.05.016
記事で見る
スコープス (8)
パブコメ
概要
全文
全文PDF
Google Scholar
アンドルファットP.
ショウジョウバエのノンコーディングDNAの適応進化。
Nature. 2005; 437: 1149-1152
https://doi.org/10.1038/nature04107
記事で見る
スコープス (471)
パブコメ
クロスリファレンス
グーグル奨学生
テネサ A.
ナバロP.
ヘイズ B.J.
ダフィー D.L.
クラーク G.M.
ゴダード M.E.
Visscher P.M.
連鎖不平衡から推定される最近のヒトの有効人口サイズ。
ゲノム研究 2007; 17: 520-526
https://doi.org/10.1101/gr.6023607
記事で見る
スコープス (306)
PubMed
クロスリファレンス
グーグル奨学生
Dunn J.C.
ISODATAプロセスのファジー相対化とコンパクトなよく分離されたクラスタの検出におけるその使用。
J. Cybern. 1973; 3: 32-57
https://doi.org/10.1080/01969727308546046
記事で見る
スクープ (4513)
クロスリファレンス
Google Scholar
ハーパック A.
バスカールA.
プリチャード J.K.
変異率の変動は、ヒトにおける対立遺伝子頻度分布の主要な決定要因である。
PLoS Genet. 2016; 12: e1006489
https://doi.org/10.1371/journal.pgen.1006489
記事で見る
スコープス (25)
PubMed
クロスリファレンス
グーグル奨学生
バーンスタインB.E.
ミケルセンT.S.
Xie X.
カマルM.
ヒューバート D.J.
カフ J.
フライ B.
マイスナーA.
ヴェルニッヒ M.
プラースK.
他。
二価のクロマチン構造が胚性幹細胞における重要な発生遺伝子をマークしている。
Cell. 2006; 125: 315-326
https://doi.org/10.1016/j.cell.2006.02.041
記事で見る
スコープス (4007)
パブコメ
概要
全文
全文PDF
Google Scholar
ヴォイグト P.
ティーW.W.
ラインバーグ D.
二価のプロモーターの二番煎じ。
Genes Dev. 2013; 27: 1318-1338
https://doi.org/10.1101/gad.219626.113
記事で見る
スコープス (543)
パブコメ
クロスリファレンス
グーグル奨学生
アイエロ L.C.
ウィーラーP.
高価な組織仮説:ヒトと霊長類の進化における脳と消化器系。
Curr。Anthropol. 1995; 36: 199-221
記事で見る
クロスリファレンス
Google Scholar
クラインJ.C.
キースA.
アガーワルV.
ダーラム T.
シェンドゥアJ.
霊長類の系統におけるエンハンサー進化の機能的特徴づけ。
ゲノムバイオロジー 2018; 19: 99
https://doi.org/10.1186/s13059-018-1473-6
記事で見る
スコープス(18)
PubMed
クロスリファレンス
グーグル奨学生
ノバコウスキー T.J.
バデュリA.
ポレンA.A.
アルバラドB.
モスタジョ・ラジ M.A.
ディ・ルッロE.
ヘウスラーM.
サンドバル-エスピノーサ C.
リュー S.J.
ベルメシェフD.
他
ヒト大脳皮質の発達階層を明らかにする時空間的遺伝子発現トラジェクトリ。
サイエンス. 2017; 358: 1318-1323
https://doi.org/10.1126/science.aap8809
記事で見る
スコープス (393)
パブコメ
クロスリファレンス
グーグル奨学生
ポーレンA.A.
バドゥーリA.
アンドリュースM.G.
ノワコウスキー T.J.
マイヤーソン O.S.
モスタジョ・ラジ M.A.
ディ・ルッロ E.
アルヴァラド B.
ベドッリ M.
ダハティ M.L.
他
ヒト特異的脳進化モデルとしての大脳オルガノイドの確立。
Cell. 2019; 176 (743.e17-756.e17)
https://doi.org/10.1016/j.cell.2019.01.017
記事で見る
スコープス(229)
PubMed
アブストラクト
全文
全文PDF
Google Scholar
ラ・マンノ G.
シレッティK.
ファーラン A.
Gyllborg D.
ヴィンスランドE.
モッシ・アルビアック A.
マッツソン・ランセス C.
クヴェン I.
レデラーA.R.
ドラトヴァL.M.
他
マウス脳発達の分子構造。
Nature. 2021; 596: 92-96
https://doi.org/10.1038/s41586-021-03775-x
記事で見る
スコープス (59)
PubMed
クロスリファレンス
グーグル奨学生
シェウ C.J.
カルモナモラP.
ソトD.C.
マストラス・M.
ロバーツ E.
ローザス J.
ジャガナサン D.
カヤ G.
オギーン H.
Dennis M.Y.
ヒト重複遺伝子の発現差に寄与する多様な分子機構。
Mol. Biol. Evol. 2021; 38: 3060-3077
https://doi.org/10.1093/molbev/msab131
記事で見る
Scopus (3)
PubMed
クロスリファレンス
グーグル奨学生
ニールソンK.M.
クラインS.L.
Mhaske P.
ムードK.
ダーI.O.
ムーディ S.A.
FoxD4/5の特定ドメインは、神経転写因子遺伝子を活性化・抑制し、未熟な神経外胚葉から分化神経板への進行を制御している。
Dev. Biol.2012; 365: 363-375
https://doi.org/10.1016/j.ydbio.2012.03.004
記事で見る
スコープス (25)
PubMed
クロスリファレンス
グーグル奨学生
シャーマン J.H.
カルピンスキーB.A.
フラリッシュ M.S.
カプチーゾJ.M.
ディンザD.S.
タール A.G.
ムーディS.A.
ラマンティアA.S.
メイナード T.M.
Foxd4は神経細胞の運命の確立と神経細胞の分化に必須である。
Genesis. 2017; 55: e23031
https://doi.org/10.1002/dvg.23031
記事で見る
スコープス(12)
クロスリファレンス
グーグルスカラー
ミノレッティ P.
アーラM.
エマヌエーレE.
オリヴィエリ V.
アルデギ A.
ポリティ P.
マルティネッリ V.
ペセンティ S.
Falcone C.
拡張型心筋症、強迫性障害、自殺傾向のあるヒトFOXD4遺伝子のW148R変異。
Int. J. Mol. Med. 2007; 19: 369-372
https://doi.org/10.3892/ijmm.19.3.369
記事で見る
スコープス (16)
PubMed
クロスリファレンス
グーグル奨学生
ファン Y.
ニューマンT.
リナルドプルーE.
トラスク B.J.
ヒト染色体2q13-2q14.1およびパラロガス領域における祖先染色体融合部位の遺伝子量と機能.
ゲノム研究 2002; 12: 1663-1672
https://doi.org/10.1101/gr.338402
記事で見る
Scopus (48)
PubMed
クロスリファレンス
グーグル奨学生
ケント・W.J.
BLAT-BLASTライクなアライメントツール。
ゲノム研究 2002; 12: 656-664
https://doi.org/10.1101/gr.229202
記事で見る
スクープ (0)
PubMed
クロスリファレンス
グーグル奨学生
鈴木一憲
ガクエルD.
ヴァン・ホイックR.
クマール D.
Wojno M.
ビリューA.
ヘルポエル A.
ランバート N.
シェロン J.
Polleux F.
他。
ヒト特異的NOTCH2NL遺伝子は、デルタ/ノッチ制御により大脳皮質神経新生を拡大する。
Cell. 2018; 173 (1370.e16-1384.e16)
https://doi.org/10.1016/j.cell.2018.03.067
記事で見る
スコープス(186)
PubMed
アブストラクト
全文
全文PDF
Google Scholar
フィデス I.T.
ポーレンA.A.
デイビス J.M.
シケラ J.M.氏
ヒト脳の進化におけるヒト特異的オルドバイドメインとNOTCH2NL遺伝子のペア関与。
Hum. Genet. 2019; 138: 715-721
https://doi.org/10.1007/s00439-019-02018-4
記事で見る
スコープス (13)
PubMed
クロスレフ
グーグル奨学生
オブルネス M.S.
ディケンズC.M.
デュマL.J.
ケーラー・ザヴァツキー H.
ワイコフG.J.
シケラ J.M.
DUF1220タンパク質ドメインの進化史とゲノム構成.
G3 (Bethesda). 2012; 2: 977-986
https://doi.org/10.1534/g3.112.003061
記事で見る
Scopus (58)
PubMed
クロスリファレンス
グーグル奨学生
デュマ・L.J.
オブルネス M.S.
デイビスJ.M.
ディケンズ C.M.
アンダーソン N.
キーニー J.G.
ジャクソン J.
シケラ M.
ラズナハン A.
ギードJ.
他
DUF1220ドメインのコピー数がヒトの脳サイズの病理学と進化に関与している。
Am. J. Hum. Genet. 2012; 91: 444-454
https://doi.org/10.1016/j.ajhg.2012.07.016
記事で見る
スコープス (91)
パブコメ
概要
全文
全文PDF
Google Scholar
サベティ P.C.
シャフナー S.F.
フライB.
ロミュラーJ.
バリリーP.
シャモフスキー O.
パルマ A.
ミケルセン T.S.
アルトシュラーD.
ランダーE.S.
ヒトの系統における正の自然選択。
サイエンス。2006; 312: 1614-1620
https://doi.org/10.1126/science.1124309
記事で見る
スコープス (801)
PubMed
クロスリファレンス
グーグル奨学生
ヘイグッドR.
フェドリゴO.
ハンソンB.
横山 圭一
Wray G.A.
多くの神経・栄養関連遺伝子のプロモーター領域は、ヒトの進化の過程で正の淘汰を受けてきた。
Nat. Genet. 2007; 39: 1140-1144
https://doi.org/10.1038/ng2104
記事で見る
スコープス (220)
PubMed
クロスリファレンス
グーグル奨学生
テイラー M.S.
マッシンガムT.
林崎由美子
カルニンチ P.
ゴールドマン N.
Semple C.A.M.
急速に進化するヒトのプロモーター領域
Nat. Genet. 2008; 40(著者返信1263-1264)。1262-1263
https://doi.org/10.1038/ng1108-1262
記事で見る
スコープス (15)
PubMed
クロスリファレンス
グーグル奨学生
フクオカT.
ジョーダンJ.
ヴァン・ブリューゲルM.E.
ハラバティA.
ティッシャーC.
ポリドーロ P.
アベ N.
ツァイ A.
マン R.S.
スターン D.L.
クロッカー J.
発生エンハンサーにおける高密度で多面的な制御情報
Nature. 2020; 587: 235-239
https://doi.org/10.1038/s41586-020-2816-5
記事で見る
スコープス (26)
PubMed
クロスリファレンス
グーグル奨学生
チャン・Y.F.
マークスM.E.
ジョーンズ F.C.
ビラレアルG.
シャピロM.D.
ブレイディS.D.
サウスウィック A.M.
アブシャーD.M.
グリムウッドJ.
シュムッツJ.
他
Pitx1エンハンサーの反復的欠失によるスティッキバックの骨盤縮小の適応進化。
Science. 2010; 327: 302-305
https://doi.org/10.1126/science.1182213
記事で見る
スコープス (700)
PubMed
クロスリファレンス
グーグル奨学生
トンプソン A.C.
カペリーニT.D.
グエンサーC.A.
チャン・Y.F.
インファンテC.R.
メンケ D.B.
Kingsley D.M.
Pitx1遺伝子近傍の新規エンハンサーが脊椎動物の骨盤付属器の発生と進化に影響を与えていることを明らかにした。
eLife. 2018; 7: e38555
https://doi.org/10.7554/eLife.38555
記事で見る
スコープス(26)
PubMed
クロスリファレンス
グーグル奨学生
Xie K.T.
ワン・ジー
トンプソン A.C.
ウーヘルプフェニッヒ J.I.
ライムヘン T.E.
マッコール A.D.C.
シュルーター D.
ベルM.A.
バスケスK.M.
キングスレーD.M.
ハリヨの骨盤縮小の並進進化におけるDNAの脆弱性。
サイエンス. 2019; 363: 81-84
https://doi.org/10.1126/science.aan1425
記事で見る
スコープス (87)
PubMed
クロスリファレンス
グーグル奨学生
マイヤーM.
キルヒャーM.
Gansauge M.-T.
リー H.
ラシモ F.
マリック S.
シュライバー J.G.
ジェイ・エフ.
プリューファー K.
de Filippo C.
et al.
古代のデニソワ人個体のハイカバレッジゲノム配列。
Science. 2012; 338: 222-226
https://doi.org/10.1126/science.1224344
記事で見る
スコープス (1109)
パブコメ
クロスリファレンス
グーグル奨学生
ウェイ X.
Xiang Y.
ピータース D.T.
マリウス C.
サン T.
シャン・R.
Ou J.
リン X.
Yue F.
Li W.
他
HiCARはオープンクロマチンに関連したゲノム構成を解析するための頑健かつ高感度な手法である。
Mol. Cell. 2022; 82 (1225.e6-1238.e6)
https://doi.org/10.1016/j.molcel.2022.01.023
記事で見る
スクープ (6)
概要
全文
全文PDF
Google Scholar
プラド・マルティネス J.
サドマントP.H.
キッド J.M.
リー・エイチ
ケリーJ.L.
ロレンテ・ガルドスB.
ヴィーラマ・K.R.
ワーナーA.E.
オコナー・T.D.
サンペールG.
他
類人猿の遺伝的多様性と集団の歴史
Nature. 2013; 499: 471-475
https://doi.org/10.1038/nature12228
記事で見る
スコープス (520)
パブコメ
クロスリファレンス
グーグル奨学生
ナバロ・ゴンザレスJ.
ツヴァイA.S.
スピアM.L.
シュメルターD.
ローゼンブルームK.R.
レイニーB.J.
パウエル C.C.
ナサール L.R.
モールディング N.D.
リーC.M.
他
UCSC Genome Browserデータベース:2021年更新。
核酸医薬研究2021; 49: D1046-D1057
https://doi.org/10.1093/nar/gkaa1070
記事で見る
スコープス (146)
パブコメ
クロスリファレンス
グーグル奨学生
プリューファー K.
デ・フィリッポ・C.
グロートS.
マフェッソーニ F.
コルレヴィッチ P.
ハジュディニャック M.
ヴェルノ B.
スコフ L.
シエ P.
ペイレーニュ S.
他
クロアチアのヴィンディヤ洞窟から得られたハイカバレッジ・ネアンデルタールゲノム。
サイエンス. 2017; 358: 655-658
https://doi.org/10.1126/science.aao1887
記事で見る
スコープス (261)
パブコメ
クロスリファレンス
グーグル奨学生
李 浩
ダービン R.
Burrows-Wheeler変換による高速・高精度なショートリードアライメント。
Bioinform. Oxf. 2009; 25: 1754-1760
https://doi.org/10.1093/bioinformatics/btp324
記事で見る
スコープス (25823)
パブコメ
クロスリファレンス
グーグル奨学生
ラーキンM.A.
ブラックシールズG.
ブラウンN.P.
チェンナ・R.
マクゲティガンP.A.
マクウィリアムH.
ヴァレンティン F.
ウォレス I.M.
ウィルムA.
ロペスR.
他
Clustal WおよびClustal Xバージョン2.0。
Bioinform. Oxf. 2007; 23: 2947-2948.
https://doi.org/10.1093/bioinformatics/btm404
記事で見る
スコープス (22289)
PubMed
クロスリファレンス
グーグル奨学生
マクリーン・C.Y.
ブリストルD.
ヒラーM.
クラーク S.L.
シャール B.T.
ロウ C.B.
ウェンガー A.M.
ベジェラーノG.
GREATはシス制御領域の機能的解釈を向上させる。
Nat. Biotechnol. 2010; 28: 495-501
https://doi.org/10.1038/nbt.1630
記事で見る
スクープ (2425)
パブコメ
クロスリファレンス
グーグル奨学生
シンデリンJ.
アルガンダ-カレラスI.
フリーズE.
Kaynig V.
ロンゲア M.
ピエツシュ T.
プライビッシュ S.
ルーデン C.
ザールフェルト S.
シュミッドB.
他。
Fiji: 生物学的画像解析のためのオープンソースプラットフォーム。
Nat. Methods. 2012; 9: 676-682
https://doi.org/10.1038/nmeth.2019
記事で見る
スコープス (28894)
パブコメ
クロスリファレンス
グーグル奨学生
ケント W.J.
バートシュR.
ヒンリヒスA.
ミラーW.
Haussler D.
進化の大鍋:マウスとヒトのゲノムにおける重複、欠失、再編成。
Proc. Natl. Acad. Sci. USA. 2003; 100: 11484-11489
https://doi.org/10.1073/pnas.1932072100
記事で見る
スコープス (585)
パブコメ
クロスリファレンス
グーグル奨学生
ハリス・R.S.
ゲノムDNAのペアワイズアライメントの改良。
(博士論文) ペンシルバニア州立大学, 2007
記事で見る
Google Scholar
ブランシェット M.
ケント W.J.
リーマーC.
エルニツキーL.
スミット A.F.A.
ロスキンK.M.
バートシュ R.
ローゼンブルームK.
クローソン H.
グリーンE.D.
他
スレッドブロックセットアライナーによる複数ゲノム配列のアラインメント。
ゲノム研究 2004; 14: 708-715
https://doi.org/10.1101/gr.1933104
記事で見る
スクープ (989)
パブコメ
クロスリファレンス
グーグル奨学生
エドガーR.C.
MUSCLE: 時間と空間の複雑さを軽減した多重配列アライメント法。
BMC Bioinformatics. 2004; 5: 113
https://doi.org/10.1186/1471-2105-5-113
記事で見る
Scopus (5778)
パブコメ
クロスリファレンス
グーグル奨学生
シャンクS.D.
ウィーバーS.
コサコフスキー・ポンドS.L.
phylotree.js - 系統遺伝学のアプリケーション開発と対話的なデータ可視化のためのJavaScriptライブラリ.
BMCバイオインフォマティクス. 2018; 19: 276
https://doi.org/10.1186/s12859-018-2283-2
記事で見る
スコープス (21)
PubMed
クロスリファレンス
グーグル奨学生
パーセル S.
ニールB.
トッド-ブラウンK.
トーマスL.
フェレイラ M.A.R.
ベンダ-・D
マラー J.
スクラーP.
デ・バッカーP.I.W.
デイリー M.J.
シャムP.C.
PLINK。全ゲノム関連解析および集団ベースの連鎖解析のためのツールセット。
Am. J. Hum. Genet. 2007; 81: 559-575
記事で見る
スコープス (19208)
PubMed
概要
全文
全文PDF
Google Scholar
Rコアチーム
R: A language and environment for statistical computing. R Foundation for Statistical Computing (オーストリア).
https://www.R-project.org/
日付:2018年
記事で見る
グーグル・スカラー
フビッシュ M.J.
ポラード・K.S.
シーペル A.
PHASTとRPHAST:空間/時間モデルによる系統解析。
Brief. Bioinform. 2011; 12: 41-51
https://doi.org/10.1093/bib/bbq072
記事で見る
スコープス (230)
パブコメ
クロスリファレンス
グーグル奨学生
ハオ・イー
ハオ・S.
アンデルセン-ニッセンE.
マウク W.M.
鄭 S.
バトラー A.
リー M.J.
ウィルク A.J.
ダービーC.
ゼイガーM.
他
マルチモーダルなシングルセルデータの統合解析
Cell. 2021; 184 (3573.e29-3587.e29)
https://doi.org/10.1016/j.cell.2021.04.048
記事で見る
スクープ (968)
概要
全文
全文PDF
Google Scholar
チンゴラーニ P.
プラッツ A.
ワン・ルL.
クーンM.
グエン・T.
ワン・エル
ランド S.J.
ルー X.
Ruden D.M.
一塩基多型のアノテーションとその影響を予測するプログラム SnpEff: Drosophila melanogaster strain w1118; iso-2; iso-3のゲノム中のSNPs。
Fly (Austin). 2012; 6: 80-92
https://doi.org/10.4161/fly.19695
記事で見る
Scopus (5389)
PubMed
クロスリファレンス
グーグル奨学生
ライトS.
進化と集団の遺伝学 第2巻:遺伝子頻度の理論.
シカゴ大学出版会、1984年
記事で見る
Google Scholar
カロルチクD.
ヒンリヒスA.S.
ケント W.J.
UCSC ゲノムブラウザ。
Curr. Protoc. Bioinforma. 2012; 40: 1.4.1-1.4.33
https://doi.org/10.1002/0471250953.bi0104s40
記事で見る
スコープス (100)
クロスリファレンス
Google Scholar
Felsenstein J.
ペアワイズ距離から系統を推定するための交互最小二乗法。
Syst. 生物学 1997; 46: 101-111
https://doi.org/10.1093/sysbio/46.1.101
記事で見る
をご覧ください。
PubMed
クロスリファレンス
グーグル奨学生
フィッチ W.M.
マーゴリアッシュE.
系統樹の構築。
サイエンス。1967; 155: 279-284
https://doi.org/10.1126/science.155.3760.279
記事で見る
スコープス (2399)
PubMed
クロスリファレンス
グーグル奨学生
シュラーゴC.G.
ボロッホC.M.
リラックスクロック法で推定したヒト科動物のタイムスケールの精度。
J. Evol. Biol. 2013; 26: 746-755
https://doi.org/10.1111/jeb.12076
記事で見る
スコープス (22)
PubMed
クロスリファレンス
グーグル奨学生
ヤン Z.
クマール S.
Nei M.
祖先のヌクレオチド配列とアミノ酸配列の新しい推論方法。
Genetics. 1995; 141: 1641-1650
記事で見る
PubMed
クロスリファレンス
グーグル奨学生
ジュークス T.H.
カンターC.R.
第24章 タンパク質分子の進化
において。マンローH.N.哺乳類蛋白質代謝. アカデミック出版、1969年:21-132
https://doi.org/10.1016/B978-1-4832-3211-9.50009-7
記事で見る
クロスリファレンス
Google Scholar
木村光太郎.
分子レベルでの進化速度。
Nature. 1968; 217: 624-626
https://doi.org/10.1038/217624a0
記事で見る
スコープス (2079)
PubMed
クロスリファレンス
グーグル奨学生
プリューファー K.
ラシモF.
パターソンN.
ジェイ・エフ
サンカラマンS.
ソーヤーS.
ハインツェ A.
ルノーG.
スドマントP.H.
de Filippo C.
他
アルタイ山脈のネアンデルタール人の全ゲノム配列。
ネイチャー. 2014; 505: 43-49
https://doi.org/10.1038/nature12886
記事で見る
スコープス (1210)
PubMed
クロスリファレンス
グーグル奨学生
オートンA.
ブルックスL.D.
ダービンR.M.
ギャリソンE.P.
カン・H.M.
コーベルJ.O.
マルキーニ J.L.
マッカーシー S.
マクビーンG.A.
他
1000 ゲノムプロジェクトコンソーシアム
ヒトの遺伝的変異のグローバルリファレンス
ネイチャー. 2015; 526: 68-74
https://doi.org/10.1038/nature15393
記事で見る
スコープス (8122)
PubMed
クロスリファレンス
グーグル奨学生
ロウ C.B.
ケリスM.
シーペルA.
レイニーB.J.
クランプ M.
サラマ S.R.
キングスレーD.M.
リンドブラッド-トーK.
ハウスラーD.
脊椎動物の進化における制御の革新の3つの時期。
サイエンス。2011; 333: 1019-1024
https://doi.org/10.1126/science.1202702
記事で見る
スコープス (90)
パブコメ
クロスリファレンス
グーグル奨学生
李 浩
ハンザカーB.
ワイソーカーA.
フェネル・T.
ルアン J.
ホーマーN.
マースG.
アベカシスG.
ダービン R.
1000ゲノムプロジェクトデータ処理サブグループ
配列アラインメント/マップ形式とSAMtools.
バイオインフォマティクス。2009; 25: 2078-2079
https://doi.org/10.1093/bioinformatics/btp352
記事で見る
スコープス (30582)
パブコメ
クロスリファレンス
グーグル奨学生
ボックリーC.M.
ディポリットA.M.
マクダウェルI.C.
マジョロスW.H.
サフィ A.
ソン L.
クロフォード・G.E.
レディ T.E.氏
GRの直接結合部位は、ヒトゲノム上のTF結合クラスターを増強する。
Cell. 2016; 166 (1269.e19-1281.e19)
https://doi.org/10.1016/j.cell.2016.07.049
記事で見る
スコープス (104)
パブコメ
概要
全文
全文PDF
Google Scholar
ギブソン D.G.
ヤング L.
チュアンR.-Y.
ベンター J.C.
ハッチソンC.A.
スミス H.O.
数百キロ塩基までのDNA分子の酵素による組み立て
Nat. Methods. 2009; 6: 343-345
https://doi.org/10.1038/nmeth.1318
記事で見る
スコープス (5303)
パブコメ
クロスリファレンス
グーグル奨学生
齋藤徹
中辻直樹
In vivoエレクトロポレーション法によるマウス胎生期の脳への効率的な遺伝子導入。
Dev. バイオロジー 2001; 240: 237-246
https://doi.org/10.1006/dbio.2001.0439
記事で見る
スコープス (596)
PubMed
クロスリファレンス
グーグル奨学生
ガスペリーニ M.
ヒル A.J.
マクファリン-フィゲロアJ.L.
マーティン B.
キム S.
チャン・M.D.
ジャクソンD.
リーズ A.
シュライバー J.
ノーブルW.S.
他
細胞遺伝学的スクリーニングによる遺伝子制御のマッピングのためのゲノムワイドなフレームワーク。
Cell. 2019; 176 (377.e19-390.e19)
https://doi.org/10.1016/j.cell.2018.11.029
記事で見る
スコープス (196)
アブストラクト
全文
全文PDF
Google Scholar
バトラーA.
ホフマンP.
スミベルトP.
パパレキ・E.
Satija R.
異なる条件、技術、種にまたがる単一細胞トランスクリプトームデータの統合。
Nat. Biotechnol. 2018; 36: 411-420
https://doi.org/10.1038/nbt.4096
記事で見る
スコープス (3862)
パブコメ
クロスリファレンス
グーグル奨学生
ベヒトE.
マッキネスL.
ヒーリーJ.
Dutertre C.-A.
Kwok I.W.H.
Ng L.G.
ジンホウクス F.
ニューウェル E.W.
UMAPを用いた単一細胞データ可視化のための次元削減。
Nat. Biotechnol. 2018; 37: 38-44
https://doi.org/10.1038/nbt.4314
記事で見る
スコープス (1472)
クロスリファレンス
グーグルスカラー
ブニエーロ A.
マッカーサーJ.A.L.
セレーゾ M.
ハリス・L.W.
ヘイハースト J.
マランゴーン C.
マクマホン A.
モラレス J.
マウントジョイ E.
ソリスE.
など。
NHGRI-EBI GWAS catalog of published genome-wide association studies, targeted arrays and summary statistics 2019(公開されたゲノムワイド関連研究、標的アレイ、要約統計のカタログ)。
ヌクレイック・アシッズ・レズ(Nucleic Acids Res.) 2019; 47: D1005-D1012
https://doi.org/10.1093/nar/gky1120
記事で見る
スコープス (1509)
PubMed
クロスリファレンス
グーグル奨学生
ジョーダンD.M.
ベルバンクM.
Do R.
HOPS: a quantitative score reveals pervasive horizontal pleiotropy in human genetic variation is driven by extreme polygenicity of human traits and diseases.ヒトの遺伝的変異における広範な水平プリオトロピーは、ヒトの形質と疾患の極端な多因子性によってもたらされていることを明らかにする。
ゲノム・バイオロジー 2019; 20: 222
https://doi.org/10.1186/s13059-019-1844-7
記事で見る
スコープス(24)
PubMed
クロスリファレンス
グーグル・スカラー
記事情報
出版年譜
掲載されました。2022年11月23日
受理されました。2022年10月14日
改訂版受理 2022年9月8日
2022年9月8日 2022年6月9日
身分証明書
DOI: https://doi.org/10.1016/j.cell.2022.10.016
著作権について
© 2022 The Author(s). 発行:エルゼビア株式会社
ユーザーライセンス
クリエイティブ・コモンズ 表示 (CC BY 4.0) | 情報アイコンを再利用する方法
サイエンスダイレクト
ScienceDirectでこの記事にアクセスする
図
図のサムネイルfx1
図版の概要
図のサムネイル gr1
図1HAQER(ヒトゲノムの中で最も速く進化した領域
図のサムネイル Figs1
図1対立遺伝子頻度スペクトルから選択の強さと方向を検出するモデル(合成対立遺伝子頻度データで検証)(図1関連
図1.図2.図3.図
図S2系統樹スコアと選択の関係、図1に関連する種間で急速に進化した領域の遺伝子オントロジー
図1.図2.図3.図4.図5.図6サムネイル
図S6ヒト特異的神経発達調節革新を伴うHAQERのゲノム状況;HAQERに重なる疾患関連変異の特徴、図4、5、6に関連する。
図1.図2.図3.図3サムネイル
図S3HAQER進化における変異率、固定化、スペクトル;HAQERの集団構造解析のための30ウェイアラインメント、図2に関連する。
図2サムネイルgr2
図2HAQER配列の分岐は、ヒトとネアンデルタール人の分岐の前に、正の選択によって駆動された。
図1HAQER配列の分岐
図3HAQERは二価のクロマチン状態に濃縮される
図3HAQERは二価のクロマチン状態に濃縮されている
図S4HAQERのクロマチン状態濃縮解析(図3に関連
図サムネイルgr4
図4HAQERの急激な配列分岐がホミニン特異的な神経発達エンハンサーを生成した
図5サムネイルfigs5
図S5scSTARR-seqクラスタ解析、マーカー遺伝子発現、注入時点と入力正規化の影響、図4関連
図サムネイルgr5
図5FOXD4ファミリー遺伝子近傍のホミニン特異的神経発達エンハンサーの急速な分岐は、複数の分節重複に続いている
図3.gr6
図6HAQERはヒトの疾患に関連する遺伝子変異の近傍に濃縮されている
関連記事
広告掲載
研究雑誌
細胞
癌細胞
セルケミカルバイオロジー
細胞ゲノミクス
細胞宿主・微生物
細胞代謝
セルレポート
セルレポートメディスン
セルレポート メソッド
セルレポート物理科学
細胞幹細胞
細胞システム
化学
化学触媒
カレントバイオロジー
発生細胞
ヘリオン
免疫
iScience
ジュール
物質
メド
分子細胞
ニューロン
地球
パターン
STARプロトコル
構造
トレンドレビュージャーナル
生化学
バイオテクノロジー
癌
細胞生物学
化学
認知科学
生態学・進化学
内分泌学・代謝学
遺伝学
免疫学
微生物学
分子医学
神経科学
寄生虫学
薬理学
植物科学
パートナージャーナル
AJHG
生物物理学ジャーナル
生物物理学レポート
HGGアドバンス
分子植物
分子療法ファミリー
植物通信
幹細胞レポート
イノベーション
コレクション
ベスト・オブ・セルプレス
セルプレス・レビュー
セルプレスセレクション
コンソーティアハブ
Nucleus コレクション
スナップショット・アーカイブ
ジャーナルを越えて
Cellキャリアネットワーク
セルメンター
細胞シンポジューム
ラボリンク
ウェビナー
記事を進化させる
コミュニティレビュー
Figure360
スニークピーク
STARメソッド
社会の中の科学
セル画展
セルプレスポッドキャスト
セル・プレス・ビデオ
カラーリングとコミック
リサーチアーク
コネクト
セルプレスについて
採用情報
お問い合わせ
ヘルプ&サポート
ニュースルーム
出版アラート
アクセス
購読する
今すぐ読む
図書館に薦める
INFORMATION
広告主の皆様へ
採用担当者様へ
図書館員の方へ
ご利用条件
個人情報保護方針
アクセシビリティ
当社は、サービスの提供・向上およびコンテンツのカスタマイズのためにCookieを使用しています。Cookieの設定を変更するには、このサイトのCookieの設定にアクセスしてください。
Copyright © 2022 Elsevier Inc. 第三者から提供された一部のコンテンツを除き、著作権はElsevier Inc.に帰属します。本サイトのコンテンツは、医療従事者を対象としています。
RELX
この記事が気に入ったらサポートをしてみませんか?