逆転写されたSARS-CoV-2のRNAは、培養したヒト細胞のゲノムに組み込むことができ、患者由来の組織でも発現することができる

Liguo Zhang, Alexsia Richards, View ORCID ProfileM. Inmaculada Barrasa, View ORCID ProfileStephen H. Hughes, View ORCID ProfileRichard A. Young, and Rudolf Jaenisch
a ホワイトヘッド生物医学研究所(マサチューセッツ州ケンブリッジ、02142)。
b HIV Dynamics and Replication Program, Center for Cancer Research, National Cancer Institute, Frederick, MD 21702;
c Department of Biology, Massachusetts Institute of Technology, Cambridge, MA 02142

PNAS May 25, 2021 118 (21) e2105968118; https://doi.org/10.1073/pnas.2105968118
Contributed by Rudolf Jaenisch, April 19, 2021 (sent for review March 29, 2021; reviewed by Anton Berns and Anna Marie Skalka)

論文


意義

SARS-CoV-2感染症の未解決の問題は、患者が初感染から何週間も経っても、ウイルス複製の証拠がないにもかかわらず、PCRで検出されるウイルスRNAが陽性であることが多いことです。我々は今回、SARS-CoV-2のRNAが逆転写されて感染細胞のゲノムに組み込まれ、ウイルス配列と細胞配列が融合したキメラ転写産物として発現することを示した。重要なことは、このようなキメラ転写産物が患者由来の組織で検出されることである。我々のデータは、一部の患者組織では、すべてのウイルス転写物の大部分が統合された配列に由来することを示唆している。これらのデータは、SARS-CoV-2感染の結果についての洞察であり、患者が回復後もウイルスRNAを生成し続ける理由の説明に役立つかもしれない。

概要

COVID-19から回復した患者において,重症急性呼吸器症候群コロナウイルス2(SARS-CoV-2)のRNAが長期にわたって検出され,PCR陽性反応が再発することが広く報告されているが,これらの患者の中には感染性ウイルスを排出していない者もいるようである。我々は,SARS-CoV-2のRNAが逆転写されて培養中のヒト細胞のDNAに統合され,統合された配列の転写が,患者に見られるPCR陽性反応の一部を説明する可能性を検討した。この仮説を裏付けるように、我々はSARS-CoV-2の配列のDNAコピーが感染したヒト細胞のゲノムに組み込まれることを発見した。このことから、LINE1レトロトランスポゾンは、標的を起点とした逆転写とレトロポジションのメカニズムを担っていると考えられた。また、一部の患者由来の組織では、ウイルス配列の大部分が統合されたDNAコピーから転写され、ウイルスと宿主のキメラ転写物を生成していることを示唆する証拠が見つかった。このように、ウイルス配列の統合と転写が、感染後や臨床回復後の患者におけるPCRによるウイルスRNAの検出に寄与していると考えられる。今回検出されたのは,宿主細胞のDNAに統合されたウイルスゲノムの主に3′末端に由来するサブゲノム配列のみであるため,統合されたサブゲノム配列から感染性ウイルスが生成されることはない。

重症急性呼吸器症候群コロナウイルス2(SARS-CoV-2)のPCR検査では,初感染から回復して数週間から数カ月後の患者から採取した検体で,継続的または反復的に陽性となることが報告されている(1⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓-17)。最近、回復後にSARS-CoV-2に善意で再感染したことが報告されているが(18)、COVID-19から回復した後に厳重に隔離された被験者を対象としたコホート研究では、少なくともいくつかの「再陽性」症例は再感染が原因ではないことが示唆されている(19、20)。さらに、これらのPCR陽性患者から複製能力のあるウイルスが分離されたり拡散したりすることはなく(1⇓-3, 5, 6, 12, 16)、ウイルスRNAが長期間にわたって繰り返し産生された原因は不明のままである。SARS-CoV-2は、正鎖のRNAウイルスである。他のβ-コロナウイルス(SARS-CoV-1および中東呼吸器症候群関連コロナウイルス)と同様に、SARS-CoV-2は、RNA依存性RNAポリメラーゼを用いてゲノムRNAを複製し、サブゲノムRNAを転写する(21⇓⇓-24)。SARS-CoV-2がウイルスを複製していないにもかかわらず、SARS-CoV-2のウイルスRNAが検出され続ける理由として、場合によっては、ウイルスのサブゲノムRNAのDNAコピーが、逆転写メカニズムによって宿主細胞のDNAに統合されることが考えられる。統合されたDNAコピーの転写は、最初の感染が解消された後もPCR検査の陽性の原因となる可能性がある。実際、多くの脊椎動物のゲノムに非レトロウイルス性RNAウイルスの配列が検出されており(25, 26)、いくつかの統合体では、古代の長散在核要素(LINE)レトロトランスポゾンを介してウイルスmRNAのDNAコピーが生殖細胞に統合されたことを示すシグナルが検出されている(参考文献27参照)。さらに、水胞性口内炎ウイルスやリンパ球性絨毛膜炎ウイルス(LCMV)などの非レトロウイルス性RNAウイルスは、内在性の逆転写酵素(RT)によってDNAコピーに逆転写され、ウイルス配列のDNAコピーが宿主細胞のDNAに組み込まれることが示されている(28⇓-30)。また、細胞内のRNA、例えばヒトのAPP転写産物は、神経細胞内で内因性RTにより逆転写され、結果としてAPP断片がゲノムに組み込まれて発現することが示されている(31)。自律型レトロトランスポゾンの一種であるヒトLINE1要素(ヒトゲノムの約17%)は、自身やAluなどの非自律型要素を逆転写することができ、細胞内の内因性RTの源となっている(32⇓-34)。内在性のLINE1要素は、老化したヒトの組織で発現していることが示されており(35)、LINE1を介した体細胞レトロトランスポゾンは、がん患者によく見られる(36, 37)。さらに、宿主細胞における内在性LINE1やその他のレトロトランスポゾンの発現は、SARS-CoV-2の感染を含むウイルス感染時によくアップレギュレートされる(38⇓-40)。

本研究では、SARS-CoV-2の配列が、LINE1を介したレトロポジション機構によって宿主細胞のゲノムに統合されることを示した。また、統合されたウイルス配列が転写される可能性があり、いくつかの患者サンプルでは、ウイルス転写物の大部分が統合されたウイルス配列に由来すると考えられることを示した。

結果

培養中の宿主細胞のDNAに組み込まれたSARS-CoV-2の塩基配列。
感染細胞のゲノムに組み込まれたSARS-CoV-2のゲノム配列を検出するために、3つの異なるアプローチを用いた。これらのアプローチは、Nanopore longread sequencing、Illumina paired-end whole genomic sequencing、Tn5 tagmentation based DNA integration site enrichment sequencingである。これら3つの方法はいずれも、SARS-CoV-2の配列が宿主細胞のゲノムに組み込まれることを示す証拠となった。

稀な統合イベントを検出する可能性を高めるため、SARS-CoV-2の感染前にLINE1発現プラスミドをHEK293T細胞にトランスフェクトし、感染2日後に細胞からDNAを分離した(SI付録、図S1A)。感染した細胞でSARS-CoV-2のヌクレオカプシド(NC)配列のDNAコピーをPCRで検出し(SI付録、図S1B)、ゲル精製したラージフラグメント細胞のゲノムDNAから完全なNC遺伝子(SI付録、図S1D)をクローニングした(SI付録、図S1C)。このウイルスDNAの塩基配列(NC)は、サンガーシークエンスによって確認された(データセットS1)。これらの結果は、SARS-CoV-2のRNAが逆転写され、得られたDNAが宿主細胞のゲノムに組み込まれる可能性を示唆している。

SARS-CoV-2の配列が宿主細胞のゲノムに組み込まれていることを直接示すために、感染したLINE1過剰発現HEK293T細胞から分離したDNAをナノポアのロングリードシークエンスに用いた(図1A)。図1 B-Dは、完全長のウイルスNCサブゲノムRNA配列(1,662bp)が細胞のX染色体に組み込まれ、その両側を宿主のDNA配列が取り囲んでいる例を示している。重要なのは、このフランキング配列には20bpの直接反復が含まれていることである。このような標的部位の重複は、LINE1によるレトロインテグレーションの特徴である(41, 42)。また、宿主細胞のDNAを標的とした重複配列に挟まれたNCサブゲノムRNAの部分配列からなる別のウイルスインテグラントをSI付録の図S2 A-Cに示す。いずれのケースでも、隣接する配列にはLINE1エンドヌクレアーゼのコンセンサス認識配列が含まれていた(43)。これらの結果は、SARS-CoV-2の配列が、LINE1を介したレトロポジションメカニズムによって、培養ヒト細胞のゲノムに組み込まれることを示している。表1は、回収されたすべてのリンクしたSARS-CoV-2-宿主の配列をまとめたものである。ウイルスゲノムの一部のDNAコピーは、ほとんどすべてのヒトの染色体で見つかった。図1およびSI付録の図S2に示した2つの例に加えて、2つの宿主-ウイルス接合部のうち1つだけが回収された61のインテグラントについても、細胞配列を回収した(SI付録の図S2 D-Fおよび表1、データセットS2にまとめられたキメラ配列を含むNanoporeリード)。重要なのは、約67%のヒトの配列には、コンセンサスまたはバリアントのLINE1エンドヌクレアーゼ認識配列(TTTT/Aなど)が含まれていたことである(SI付録、図S2 D-Fおよび表1)。これらのLINE1認識配列は、ウイルス配列の3′端(ポリAテール)に直接連結されたキメラ接合部にあるか、またはウイルス配列の5′端に連結された接合部から8〜27bpの距離内にあり、潜在的な標的部位の重複の範囲内にあった。いずれの結果も、LINE1を介したレトロポジションが、SARS-CoV-2サブゲノム断片のDNAコピーを宿主のゲノムDNAに統合するメカニズムを提供するというモデルと一致する。ウイルス配列の約71%はイントロンまたは遺伝子間の細胞配列に挟まれ、29%はエクソンに挟まれていた(図1Fおよび表1)。このように、ウイルス配列とエクソンとの関連性は、ゲノムへのランダムな組み込みで予想されるよりもはるかに高く[ヒトゲノム:エクソン1.1%、イントロン24%、遺伝子間DNA75%(44)]、エクソンに関連する標的部位への優先的な組み込みを示唆している。これまでの研究では、LINE1がエクソンに優先的に導入されることはないとされていたが(45, 46)、今回の発見は、他のいくつかのRNAのLINE1による導入は異なる可能性を示唆している。また、ウイルスと細胞の境界は、細胞内遺伝子の5′または3′非翻訳領域(UTR)の近くにあることが多く、我々の実験系ではプロモーターまたはポリ(A)サイトの近くに統合する傾向があることが示唆された。

画像1

図1.SARS-CoV-2
SARS-CoV-2のRNAは逆転写され、宿主細胞のゲノムに組み込まれる。(A)実験の流れ。(B) 完全長のSARS-CoV-2 NCサブゲノムRNA配列(マゼンタ)と、統合されたウイルス配列の両側に位置するヒトゲノム配列(青)が統合されたことを示すNanoporeシークエンスリードからのキメラ配列。LINE1による「標的優先逆転写」を示す特徴として、標的部位の重複(黄色のハイライト)とLINE1のエンドヌクレアーゼ認識配列(下線)が挙げられる。両方のゲノムにマッピングされる可能性のある配列を紫色で示し、ヒトゲノム配列とのミスマッチをイタリックで示した。矢印は、CおよびDに示したように、ヒトおよびSARS-CoV-2のゲノムに対する配列の向きを示している。 (C) Bのナノポアリードとヒトゲノム(X染色体)とのアライメントで、融合部位を示したもの。接合部のヒトの配列は、SARS-CoV-2のcDNAが組み込まれたときに複製された標的部位(黄色のハイライト)と、LINE1エンドヌクレアーゼ認識配列(下線)を示している。(D)BのナノポアリードとSARS-CoV-2ゲノムとのアライメントにより、統合されたウイルスDNAが完全長のNCサブゲノムRNAのコピーであることがわかる。水色のハイライト領域を拡大すると、TRS-L(I)とTRS-B(II)の配列(下線付き、これらはウイルスポリメラーゼがサブゲノムRNAを生成するためにジャンプする配列)と、ポリ(A)テールのウイルス配列の末端(III)が示されている。これらのウイルス配列の特徴(I-III)は、完全長のNCサブゲノムRNAのDNAコピーがレトロインテグレーションされたことを示している。E)イルミナ社のペアエンド全ゲノムシーケンシングから得られたヒト-ウイルスキメラのリードペア。リードペアは、ヒト(青)およびSARS-CoV-2(マゼンタ)のゲノムとのアライメントを示している。矢印は、ヒトとSARS-CoV-2のゲノムに対するリードの向きを示す。ヒトのリードマッピングのハイライト(水色)部分を拡大し、LINE1認識配列(下線)を示した。(F) ナノポア(左)およびイルミナ(右)シーケンシングによるヒト-CoV2キメラ接合体の分布を、ヒトゲノムの特徴と関連づけて示したもの。

表1.
感染したLINE1過剰発現HEK293T細胞のNanopore DNA sequencingで得られたhuman-CoV2キメラ配列の概要

画像2

SARS-CoV-2の配列がゲノムDNAに組み込まれていることを別の方法で確認するために、LINE1を導入したHEK293T細胞およびSARS-CoV-2を導入したHEK293T細胞から分離したDNAを、ライゲーションアーチファクトを避けるためにTn5ベースのライブラリ構築法(Illumina Nextera)を用いて、Illuminaペアエンド全ゲノムシーケンスに供した。ウイルスDNAのリードは、SARS-CoV-2ゲノムの3′末端に集中していた(SI付録、図S3)。ヒトとウイルスのキメラDNA配列をマッピングしたところ、17個のウイルスインテグラント(2回の複製の合計)が回収された(図1Eと表2、キメラ配列はデータセットS3にまとめてある)。接合部のうち7個(41%)には、接合部付近の細胞配列にコンセンサスまたはバリアントのLINE1認識配列が含まれており(図1Eと表2)、LINE1を介したレトロポジションのメカニズムと一致した。ナノポアシークエンスで得られた結果と同様に、ウイルス配列の約76%はイントロンまたはインタージェニックな細胞内配列に挟まれ、24%はエクソンに挟まれていた(図1Fおよび表2)。

表2.
感染したLINE1過剰発現HEK293T細胞のIlluminaペアードエンド全ゲノムDNAシーケンスで得られたhuman-CoV2キメラ配列の概要

画像3

SARS-CoV-2配列の約32%(Nanoporeでは6/21の集積イベント、Illuminaでは4/10の集積イベント)は、LINE1認識部位の証拠がないLINE、short interspersed nuclear element、またはlong terminal repeat elementで集積されていた。このことは、おそらくLCMVに急性感染した細胞で報告された逆転写/集積メカニズムに類似した別の逆転写/集積メカニズムが存在することを示唆している。

SARS-CoV-2配列のゲノム統合が、RTを過剰発現していない感染細胞でも起こりうるかどうかを評価するために、RT発現プラスミドをトランスフェクトしていないウイルス感染HEK293T細胞およびCalu3細胞からDNAを分離した(図2A)。Tn5タグメンテーションを介したDNA統合部位濃縮シークエンス(47, 48)(図2BおよびSI付録、図S4A)により、これらの細胞では、細胞配列に融合した合計7つのSARS-CoV-2配列が検出された(2つの細胞株の3回の独立した感染の合計)。これらはすべて、ヒト-SARS-CoV-2配列接合部に近いLINE1認識配列を示していた(図2 C-FおよびSI付録、図S4 B-D、データセットS4にまとめられたキメラ配列)。

画像4

図2.
逆転写酵素を過剰発現していない培養細胞におけるSARS-CoV-2 cDNAの統合の証拠。(A) 実験の流れ。(B) 宿主細胞ゲノム中の統合部位をマッピングするために用いたTn5タグメンテーションを介したエンリッチメントシーケンス法の実験デザイン。(C) ウイルスの統合をサポートするヒト-ウイルスキメラのリードペア。リードは、ヒト(青)およびSARS-CoV-2(マゼンタ)のゲノム配列とアライメントされている。矢印は、DおよびEで示したように、ヒトおよびSARS-CoV-2のゲノムに対するリードの向きを示している。エンリッチメントに使用したウイルスプライマーの配列は、リード中に緑色のハイライトで示されている(Bで図示した緑色の矢印に対応する)。両方のゲノムにマッピングされる可能性のある配列は、紫色で示した。(D) Cのリードペアとヒトゲノム(15番染色体、青矢印)のアラインメント。ヒトの配列のハイライト(水色)部分を拡大し、LINE1認識配列(下線)と19塩基のポリdT配列(紫色のハイライト)を示した。"ターゲットプライミング逆転写 "のためにウイルスのポリA尾部によってアニールされる可能性がある。また、リード2(C)には、5塩基のヒト配列(GAATG、青)が追加されており、正真正銘の組み込み部位であることが裏付けられた。(E)CのリードペアとSARS-CoV-2ゲノム(マゼンタ)のアライメント。ウイルスのプライマー配列は緑色のハイライトで示されている。(F) 2つの細胞株でエンリッチメントシーケンス法により同定された7つのヒト-ウイルスキメラ配列の概要。統合されたヒト染色体、キメラ接合部に近いLINE1認識配列、リード接合部のヒトゲノムの特徴を示す。

感染した培養細胞および患者由来の組織におけるウイルスと細胞のキメラ転写産物の発現。

ゲノムに組み込まれたSARS-CoV-2の配列が発現する可能性を調べるために、SARS-CoV-2感染細胞のRNA-seqデータを解析し、キメラ転写産物の証拠を探した(49)。これらのデータセット(50⇓⇓⇓⇓-55)(SI付録、図S5)を調べたところ、多数のヒト-ウイルスキメラリードが検出された(SI付録、図S6 AおよびB)。これらは、培養細胞や肺・心臓・脳・胃の各組織のオルガノイドなど、複数のサンプルタイプで発生していた(SI付録、図S6B)。キメラリードの量は、サンプルの種類にかかわらず、ウイルスのRNA量と正の相関が見られました(SI付録、図S6B)。キメラリードは、サンプル中のSARS-CoV-2リード全体の0.004~0.14%を占めていた。大部分のキメラ接合部は、SARS-CoV-2のNC遺伝子の配列にマッピングされた(SI付録、図S6 CおよびD)。これは、NC RNAが最も豊富なSARS-CoV-2サブゲノムRNAであるという知見(56)と一致しており、逆転写や組み込みの標的となる可能性が最も高い。しかし、最近のデータでは、SARS-CoV-2感染細胞から得られたRNA-seqリードの最大1%が、RNA-seqライブラリの調製におけるcDNA合成ステップ中に起こりうる、RNAテンプレート間のRTスイッチングの結果として、人工的にキメラ化される可能性があることが示された(57)。このように、感染細胞内には、宿主のmRNAと正鎖のウイルスのmRNAが混在しているため、アッセイにおいて人工的なキメラが生成されると、ウイルスと細胞の真のキメラRNA転写産物の同定が損なわれる。

我々は、統合されたSARS-CoV-2 RNAのDNAコピーの向きは、標的となる宿主遺伝子の向きに対してランダムであるはずだと推論し、発現している宿主遺伝子に統合されたウイルスDNAの約半数は、宿主細胞遺伝子の転写方向と反対の向きになるはずだと予測した(図3A)。予測通り、ナノポアのデータセットでは、ヒト遺伝子に取り込まれたウイルスの約50%が、宿主遺伝子に対して反対の向きになっていた(LINE1認識配列を持つヒト遺伝子での統合、図3B)。したがって、ウイルス配列が統合されてできたキメラ転写産物については、正鎖の宿主RNA配列に負鎖のウイルス配列が連結されたものが約50%含まれているはずである。そこで、感染した培養細胞・臓器や患者由来の組織に含まれるウイルスとヒトウイルスのキメラ転写産物のうち、ネガティブ鎖のウイルスRNA配列を含む割合を調べた。

画像5

図3.
負鎖のウイルスRNA-seqリードは、統合されたSARS-CoV-2配列が発現していることを示唆している。(A)正鎖または負鎖のSARS-CoV-2 RNA-seqリードのうち、ウイルスの(サブ)ゲノムRNAに由来するものと、統合されたウイルス配列の転写産物に由来するものの割合を予測したシェーマ。右の矢印は、統合されたSARS-CoV-2(マゼンタ)の正鎖の向きを、宿主細胞の遺伝子(青)の向きと比較して示している。(B) ヒト遺伝子に統合されたSARS-CoV-2配列のうち、ヒト遺伝子の正鎖に対するウイルスの正鎖の向きが同じ(n = 15)または逆(n = 13)のものの割合。感染したLINE1-overexpressing HEK293T細胞のナノポアDNAシーケンスから、LINE1エンドヌクレアーゼ認識配列を持つヒト遺伝子で合計28の組み込みイベントが同定された(図1A)。C)急性感染した細胞やオルガノイドに含まれる負鎖のウイルスRNAに由来する全ウイルスリードの割合(詳細はSI付録、表S1参照)。(D) 急性感染した細胞やオルガノイドにおいて、陰性鎖ウイルスRNAに由来するウイルス配列を含むヒト-ウイルスキメラリードの割合(詳細はSI付録、表S1参照)。(E) 公表されている患者のRNA-seqデータ(剖検FFPEサンプル、GSE150316、ウイルスリードがない、またはライブラリの鎖状性の品質が低いサンプルは含まれていない、詳細はSI Appendix, Table S2を参照、再解析結果は原著論文と一致)における、ネガティブ鎖のウイルスRNAに由来する全ウイルスリードの割合。(F) 公表されている患者のRNA-seqデータ(剖検FFPEサンプル、GSE150316;詳細はSI付録、表S2参照)において、陰性鎖のウイルスRNAに由来するウイルス配列を含むヒト-ウイルスキメラリードの割合。(G) 公表されている患者のRNA-seqデータ(BALFサンプル、GSE145926、詳細はSI付録のTable S3を参照)において、ネガティブストランドのウイルスRNAに由来する全ウイルスリードの割合。E-Gの赤い破線は、すべてのウイルスリード(EおよびG)またはヒト-ウイルスキメラリード中のウイルス配列(F)の50%がネガティブストランドウイルスRNAに由来するレベルを示しており、これはすべてのウイルス配列が統合配列に由来する場合に予想されるレベルである。

SARS-CoV2のRNAの複製には,ウイルスゲノムRNAの複製とウイルスサブゲノムの正鎖RNAの転写の鋳型となる負鎖ウイルスRNAの合成が必要である(21)。急性感染細胞における負鎖のウイルスRNAの割合を評価するために、正鎖と負鎖のRNAの合計の比率を測定した。急性感染したCalu3細胞や肺オルガノイドでは,ウイルスの総リード数の0~0.1%がネガティブ鎖RNAに由来しており(我々のデータおよび発表されたデータ(50, 58))(図3CおよびSI Appendix, Table S1),これは感染後早期に採取された臨床サンプルで報告されているものと同様であった(59).これらの結果から、急性感染細胞では、負鎖のウイルスRNAのレベルが正鎖のウイルスRNAのレベルよりも少なくとも1,000倍低いことが示唆される。これは、少なくとも部分的には、ウイルスの複製中に正鎖のサブゲノムRNAが大量に生成されるためである。これにより、RNA-seqライブラリー構築の逆転写ステップでランダムにテンプレートが切り替わることで、細胞の正鎖RNA配列に融合したウイルスの負鎖RNAを含む人工的なキメラリードが大量に生成される可能性が大幅に減少した。急性感染した細胞/臓器では、ヒト-ウイルスキメラリードの0~1%に負鎖ウイルス配列が含まれており(図3D、SI付録、表S1)、統合されたSARS-CoV-2配列に由来するウイルスリードはごく一部であると考えられた。

急性感染したCalu3細胞や肺オルガノイドで得られた結果とは対照的に、いくつかの患者由来の組織では、全ウイルスリードの最大51%、ヒト-ウイルスキメラリードの最大42.5%が、負鎖のSARS-CoV-2 RNAに由来するものであった[発表データ(60, 61)、患者の臨床背景は原著論文に記載](図3 E-G、SI付録、表S2およびS3)。重症のCOVID患者の肺気管支肺胞洗浄液(BALF)細胞のシングルセル解析(発表データ(61))では、全ウイルスリードの最大40%が負鎖のSARS-CoV-2 RNAに由来することが示された(SI付録、図S7)。一部の患者の組織における陰性鎖RNAの割合は、急性感染した細胞やオルガノイドにおける割合よりも桁違いに高かった(図3 C-G)。剖検試料では、14人中4人(図3E、SI付録、表S2)、BALF試料では、6人中4人(図3G、SI付録、表S3)が、少なくとも20%以上がネガティブ鎖RNAに由来していた。急性感染した細胞とは対照的に(図3 CおよびD、SI付録、表S1)、これらの剖検サンプルでは、ウイルスの繁殖がほとんど認められなかった(60)。SI Appendix, Table S2にまとめられているように、1人の患者から得られたサンプルでは、ヒト-ウイルスキメラリードの大部分(最大で約40%)にネガティブ鎖のウイルス配列が存在した。同じ患者から採取した別のサンプルでも同様に、ネガティブなウイルス鎖-ヒトRNAのリードの割合が高かった。他のいくつかの患者のサンプルでは、陰性のウイルス鎖RNAとヒトRNAのキメラの割合は低かったが、それでも急性感染細胞で見られたものよりも有意に高かった(図3 DおよびF、SI Appendix, Table S1およびS2)。ショートリードRNA-seqでは、ウイルスとヒトのキメラリードを同定する能力が限られているため、今回の解析では、患者のBALFサンプルに有意な数のキメラリードが見られなかった(SI Appendix, Table S3)。以上のことから、SARS-CoV-2配列陽性細胞の総数が少ない患者由来の組織では、ウイルスの転写産物の大部分が宿主ゲノムに組み込まれたSARS-CoV-2配列から転写されている可能性が示唆された。

考察

我々は、SARS-CoV-2の配列が逆転写され、培養中のヒト感染細胞のDNAに組み込まれることを示す証拠をここに提示する。また、ウイルス配列を挟んだ宿主DNAの両端には、LINE1エンドヌクレアーゼのコンセンサス認識部位が存在していた。これらのデータやその他のデータは、ターゲットプライミングによる逆転写とレトロポジション統合のメカニズムと一致しており(41、42)、内因性のLINE1 RTが感染細胞のゲノムにおけるSARS-CoV-2配列の逆転写と統合に関与している可能性が示唆された。

培養細胞で解析したウイルスのインテグラントの約30%は、近くに認識可能なLINE1エンドヌクレアーゼの認識部位がなかった。したがって、別のメカニズムで統合が起こる可能性もある。実際、LCMVに急性感染した細胞では、逆転写の際に内在性のIAP要素とのコピーチョイスによって、キメラcDNAが作られるという証拠がある。このメカニズムでは、LCMVとIAPの両方に相補的なキメラcDNAが作られると予想される。いくつかのケースでは、得られたキメラcDNAは、標的部位の重複を生じることなく統合された(29)。また、最近の研究では、コロナウイルスの配列と内在性レトロトランスポゾンとの相互作用が、ウイルスの統合メカニズムの可能性を示唆している(40)。

追跡調査では、患者の組織で宿主のゲノムに組み込まれたSARS-CoV-2の配列が存在することを証明することが重要である。しかし、ウイルス配列が陽性となる患者組織の細胞はごく一部にすぎないと予想されるため、技術的に困難である(61)。この考えと一致するように、LCMVに感染したマウスの細胞がゲノムに組み込まれたウイルスDNAコピーを持っているのは、培養または動物では1,000~100,000個に1個程度と推定されている(30)。また、一部の細胞のDNAにSARS-CoV-2の配列が組み込まれているのは、患者のほんの一部にすぎない。しかし、世界中で1億4,000万人以上のヒトがSARS-CoV-2に感染している(2021年4月現在)ことを考えると、稀な事象であっても臨床的に重要な意味を持つ可能性がある。また、感染した細胞は通常、サンプル採取前に死滅して失われるため、細胞培養アッセイでレトロインテグレーションイベントの頻度を推定することは困難である。同じ理由で、急性感染実験では、統合された細胞のクローン拡大は期待できない。さらに、異なる患者や組織で同じゲノム遺伝子座に統合される可能性は、ランダムな統合プロセスのために低いかもしれない。

また、細胞内にウイルスと宿主のキメラRNAが存在するだけでは、統合されたウイルス配列が転写されたことを示す強力な証拠とはなりません。なぜなら、cDNAライブラリー作成の逆転写ステップでテンプレートの切り替えが起こる可能性があるからです。一方、一部の患者から調製したRNA-seqライブラリでは、負鎖のSARS-CoV-2 RNAに由来する全ウイルスリードの割合、およびヒト-ウイルスキメラリードの割合が大幅に高くなっていることがわかった。レトロトランスポゾンを介した統合イベントでは、逆転写されたSARS-CoV-2 RNAの向きは、宿主遺伝子の向きに対してランダムであるはずである。したがって、統合されたウイルス配列に由来するキメラRNAでは、キメラリードの約半分が正鎖の宿主RNA配列と負鎖のウイルス配列を結びつけることになる。いくつかの患者のサンプルでは、ネガティブ鎖のウイルスリードが全ウイルスRNA配列の40~50%を占め、同様の割合のキメラリードがネガティブ鎖のウイルスRNA配列を含んでいたことから、これらのサンプルに含まれるウイルスRNAの全てではないにしても、その大部分は統合されたウイルス配列に由来するものであると考えられます。

今回検出されたのは、主に宿主細胞のDNAに統合されたウイルスゲノムの3′末端に由来するサブゲノム配列のみであるため、このような統合されたサブゲノム配列からは感染性ウイルスは産生されないことに注意する必要がある。SARS-CoV-2の配列がヒトゲノムに統合され、キメラRNAの形で発現する可能性があるということは、今後の研究のためにいくつかの問題を提起している。統合されたSARS-CoV-2配列は、患者の中でウイルス抗原を発現するのか、またそれらは病気の臨床経過に影響を与えるのか。これまでに得られた臨床的証拠によると,患者の組織内でウイルスタンパク質を発現している細胞は,せいぜい免疫組織化学で検出できるレベルのごく一部にすぎないと考えられる.しかし、SARS-CoV-2の配列が組み込まれて発現した細胞が、感染が解消された後も生き残り、ウイルス抗原やネオ抗原を提示した場合、感染性ウイルスを産生することなく、免疫を継続的に刺激することになり、一部の患者で観察されているように、防御反応や自己免疫などの症状を引き起こす可能性がある(62、63)。マウスの急性感染細胞のゲノムにLCMVの配列が組み込まれていることから、著者らは、このような配列の発現は「自然に作られたDNAワクチンの一形態である可能性がある」と推測している(30)。抗原反応を引き起こすのに必要な抗原提示細胞の数は不明だが、ウイルス感染やサイトカインへの曝露によって低下したLINE1の発現が、患者の感染細胞のゲノムへのSARS-CoV-2の統合を促す可能性がある。より一般的には、体細胞へのウイルスDNAの統合は、自然感染の結果であり、デング熱、ジカ熱、インフルエンザウイルスなどの一般的な病気を引き起こすRNAウイルスの影響にも一役買う可能性があることを示唆している。

また、今回の結果は、現在行われている抗ウイルス療法の臨床試験にも関連する可能性がある(64)。ウイルスRNAの統合と発現がかなり一般的である場合、ウイルス複製とウイルス量に対する治療法の効果を判定するために、非常に感度の高いPCR検査に依存することは、ウイルス複製を完全に抑制する治療法の能力を必ずしも反映しない可能性がある。

材料と方法

細胞培養とプラスミドの導入
HEK293T細胞は、ATCC(CRL-3216)から入手し、10%熱不活化FBS(HyClone;SH30396.03)と2mM L-グルタミン(MP Biomedicals;IC10180683)を添加したDMEMで、ATCCの方法に準じて培養した。Calu3細胞は、ATCC(HTB-55)から入手し、10%熱不活化FBS(HyClone;SH30396.03)を添加したEMEM(ATCC;30-2003)でATCCの方法に従って培養した。

ヒトLINE1発現用のプラスミド、pBS-L1PA1-CH-mneo(CMV-LINE-1)は、Astrid Roy-Engel, Tulane University Health Sciences Center, New Orleans, LAからの寄贈品である(Addgene plasmid #51288 ; http://addgene. org/51288; RRID:Addgene_51288)(65);EF06R (5′UTR-LINE-1)は、Eline Luning Prak, University of Pennsylvania, Philadelphia, PA (Addgene plasmid #42940 ; http://addgene.org/42940; RRID:Addgene_42940)(66)からの贈り物であった。トランスフェクションは、メーカーのプロトコルに従ってLipofectamine 3000(Invitrogen;L3000001)を用いて行った。

SARS-CoV-2の感染。
SARS-CoV-2 USA-WA1/2020(GenBank: MN985325.1)をBEI Resourcesから入手し、Vero細胞上で展開してティターした。細胞は、HEK293T細胞への感染については感染多重度(MOI)0.5、Calu3細胞への感染についてはMOI1または2を用いて、DMEM+2%FBSで48時間感染させた。サンプルの処理および感染性ウイルスを用いた収穫は、すべてラゴン研究所のBSL3施設で行った。

核酸の抽出とPCRアッセイ。
細胞DNAの抽出は、公表されている方法を用いて行った(31)。ゲノムDNAの精製には、全細胞DNAを0.4%(wt/vol)アガロース/1×TAEゲルで3V/cmの電圧で1.5時間分画し、サイズマーカーとしてλ DNA-HindIII Digest(NEB; N3012S)を用いた。大きな断片(>23.13kb)を切り出し、-80℃で凍結した後、ピペットチップで粉砕した。3容量(vol/wt)の高T-E緩衝液(10mM Tris-10mM EDTA, pH8.0)を加えた後、NaClを加えて最終濃度を200mMにした。このゲル液を70℃で15分間攪拌しながら加熱した後、フェノール:クロロホルム:イソアミルアルコール(25:24:1、vol/vol/vol)(ライフテクノロジー社;15593031)およびクロロホルム:イソアミルアルコール24:1(シグマ社;C0549-1PT)で抽出した。酢酸ナトリウムとイソプロピルアルコールを加えてDNAを沈殿させた。DNA濃度が低いサンプルには、グリコーゲン(Life Technologies; 10814010)をキャリアとして加え、沈殿を助けた。

RNAの抽出は,RNeasy Plus Micro Kit(Qiagen;74034)を用いて,メーカーのプロトコールに従って行った。

SARS-CoV-2配列のDNAコピーを検出するために、COVID-19試験で使用されている4つのNC遺伝子標的PCRプライマーセットを選択した[SI付録、図S1A、プライマーソースは世界保健機関(67)から、NC_045512.2のゲノムバージョンに合わせて変更]。本研究で使用したPCRプライマー配列については、SI付録、表S4を参照のこと。PCRは、AccuPrime Taq DNA Polymerase, high fidelity (Life Technologies; 12346094)を用いて行った。PCR産物を1%または2%(wt/vol)のアガロースゲルにかけ、増幅を示した。

ナノポアDNAシークエンスと解析。
pBS-L1PA1-CH-mneo(CMV-LINE-1)プラスミドをトランスフェクションし、SARS-CoV-2を感染させたHEK293T細胞から抽出した合計1.6μgのDNAを、SQK-LSK109キット(Oxford Nanopore Technologies)を用いてシーケンスライブラリを作成し、1台のR9 PromethIONフローセル(FLO-PRO002)で3d、5分間のシーケンスを行った。シーケンスデータは、Guppy 4.0.11 (Oxford Nanopore Technologies)を用いて高精度モデルでベースコールした。

ナノポアリードは、minimap2(68)(バージョン2.15)を用いてパラメータ「-p 0.3 -ax map-ont」でマッピングし、ENSEMBLリリース93( ftp://ftp.ensembl.org/pub/release-93/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz )のヒトゲノム配列とSARS-CoV-2配列(GenBank ID: MN988713.1, "Severe acute respiratory syndrome coronavirus 2 isolate SARS-CoV-2/human/USA/IL-CDC-IL1/2020, complete genome.". SAMファイルから、ウイルスゲノムにマッピングされたすべての配列を選択し、マッピングされたヒト染色体に基づいてグループに分けました。選択した配列を、blastnを用いて、上記のヒトとウイルスの配列で作成したBLASTデータベースと照合しました。ブラストの出力を、カスタムのPerlスクリプトを用いて、高得点セグメントペア(HSP)ごとに1行のテキストファイルに解析した。さらに、各配列について、すべてのウイルスHSPと上位3つのヒトHSPを選択して、そのファイルをフィルタリングしました。これらのファイルを目視で確認し、ヒト-ウイルス、ヒト-ウイルスの接合部を含む配列を特定しました。30kb以上のいくつかの配列については、上位15個のヒトHSPを調べた。さらに、カリフォルニア大学サンタクルーズ校(UCSC)のBLAT(69)ツールを用いて、ヒトとウイルスの配列を含む同定されたすべてのリードを目視で検査しました。これらのリードの一部には、ナノポア・シーケンシングやベースコールのエラーにより、人工的な「ハイブリッド配列」が存在しており、同じDNA断片のワトソン鎖とクリック鎖が同じリードに存在することもある。そこで、ヒトとウイルスの明確な接合を示すキメラ配列のみに着目し、標的部位の重複やLINE1エンドヌクレアーゼ認識配列など、既知のLINE1によるレトロポジションの特徴を分析して、統合の証拠とした。

Tn5タグメンテーションによる統合サイトの濃縮。
我々は、タグメンテーションに基づく方法を用いて、ウイルスの統合サイトを濃縮した(47, 48)。簡単に説明すると、Tn5トランスポザーゼ(Diagenode社;C01070010)を用いて、細胞DNAをアダプター(アダプターA、Illumina Nexteraシステム)でランダムにタグメンテーションした。タグメンテーションは、100ngのDNAを用いて55℃で10分間行い、その後SDSでDNAからTn5 transposaseを剥離した。SARS-CoV-2 NC遺伝子の5′端付近をターゲットにしたリバースプライマー(CCAAGACGCAGTATTGGGTAAA)またはSARS-CoV-2ゲノムの3′端付近をターゲットにしたフォワードプライマー(CTTGTGCAGAATGAATTCGTAACT)を用いて,ウイルス配列を含むタグ付けされたDNA断片を直線的に増幅した(PCR0,45サイクル)。PCR0の産物を取り出し、アダプター配列に対するバーコード付き(i5)Nexteraプライマー(AATGATACGGCGACCACCGAGATCTACNNNNTCGGCAGCGTC、NNNNNNNはバーコードを示す)とウイルスプライマーを用いて、PCR1を15~20サイクル用いて、アダプター配列とウイルス配列を含むDNA断片(潜在的な統合部位)を増幅した。ウィルスプライマーは,SARS-CoV-2 NC遺伝子の5′末端付近をターゲットにしたもの(GTCTCGTGGGCTCGGAGATGTATAAGACAGGCCGACGTTGTTTTGATCG, またはSRAS-CoV-2ゲノムの3′末端付近(GTCTCGTGGGCTCGGAGATGTATAAGACAGCGCGGAGTACGATCGAGTG,下線部がウイルス配列)を標的としたものであった。このウイルスプライマーには、さらにPCRを増幅するためのアダプター配列も含まれていた。i5 Nexteraプライマー配列に対するショートプライマー(AATGATACGGCGACCACCGA)と、PCR1のウイルスプライマーによって導入されたアダプター配列に対するバーコード付き(i7)Nexteraプライマー(CAAGCAGAAGACGGCATACGAGATNNNNNNGTCGTGGGCTCGG、NNNNNNはバーコードを示す)を用いて、PCR2を15〜20サイクル行い、PCR1の産物を増幅した。PCR2増幅の最終産物は、PippinHT(Sage Science;HTP0001)を用いて1.5%アガロースゲル(Sage Science;HTC1510)上で分画し、500〜1,000bpの断片をイルミナのペアエンドシーケンシングのために選択した。PCRの3ステップ(PCR0-PCR2)はすべてKAPA HiFi HotStart ReadyMix(KAPA;KK2602)で行った。

イルミナDNAシークエンスと解析。
Tn5ベースのIllumina DNA Prep kit(Illumina;20018704)を用いて、HEK293T細胞の全ゲノムシークエンス用のライブラリを構築した。全ゲノムシーケンシング用ライブラリ、またはサイジング(上述)後のTn5媒介統合部位の濃縮によるライブラリをイルミナシーケンシングに供した。 qPCRは、製造者のプロトコルに従い、KAPA qPCR library quant kitを用いて各ライブラリの濃度を測定した。その後、qPCR濃度に基づいて、各レーンごとに等モル濃度でライブラリをプールした。プールされたライブラリは、イルミナのプロトコルを用いて変性させました。変性したライブラリーをIllumina NovaSeq 6000のSPフローセルにロードし、メーカーの指示に従って2×150サイクル実行しました。Fastqファイルを生成し、bcl2fastq Conversion Software (Illumina)を用いてデマルチプレックスした。

ヒト-SARS-CoV-2キメラDNAリードを同定するために、生のシーケンスリードを、STAR(70)(バージョン2.7.1a)を用いて、National Center for Biotechnology Information(NCBI)参照配列NC_045512.2のSARS-CoV-2配列に連結された代替染色体を持たないヒトゲノム配列バージョンhg38を含むfastaファイルで作成したヒト+SARS-CoV-2ゲノムにアラインした。キメラリードの呼び出しには、以下のSTARパラメータを使用しました。-alignIntronMax 1 ˶-chimOutType Junctions SeparateSAMold WithinBAM HardClip ˶-chimScoreJunctionNonGTAG 0 ˶-alignSJstitchMismatchNmax -1-1 -1-1 ˶-chimSegmentMin 25 ˶-chimJunctionOverhangMin 25 ˶-outStype BAM SortedByCoordinate. 生成されたBAMファイルから、samtools(71)(バージョン1.11)を用いて、以下のコマンドでウイルスのリードを抽出した: samtools view -b Aligned.sortedByCoord.out.bam NC_045512v2 > NC_Aligned.sortedByCoord.out.bam. java -jar picard.jar FilterSamReads I = Chimeric.out.sam O = hv-Chimeric.out.sam READ_LIST_FILE = hv-Chimeric.out.junction.ids FILTER = includeReadList.I = Chimeric.out.sam O = hv-Chimeric.out.sam READ_LIST_FILE = hv-Chimeric.out.junction.ids FILTER = includeReadList. さらに、各キメラリードを確認し、UCSC BLAT(69)ツールを用いた目視検査により、納得のいかないリード(短すぎるリードや、ヒトゲノムの複数の部位にアラインしているリード)をフィルタリングしました。また、STARが生成したAligned.sortedByCoord.out.bamファイル、または抽出したウイルスリードを含むNC_Aligned.sortedByCoord.out.bamファイルをUCSCブラウザのSARS-CoV-2ゲノム(NC_045512.2)にロードし、STARのキメラコール法で見逃された追加のキメラリードを検索しました。ゲノムカバレッジファイルを生成するために、deepToolsスイート(72) (バージョン3.5.0)のbamCoverageを使用して、STARが生成したAligned.sortedByCoord.out.bamファイルを、次のコマンドで10bpでビン化したbigwigファイルに変換しました。

RNA-seqと解析。
ヒト-SARS-CoV-2キメラリードを同定するために、公開されているRNA-seqデータをGene Expression Omnibus(GEO)からダウンロードし、アクセッション番号GSE147507(50)、GSE153277(51)、GSE156754(52)、GSE157852(53)、GSE153684(54)、およびGSE154998(55)とした(SI付録、図S5Cにまとめた)。生のシーケンスリードは、STAR(70)(バージョン2.7.1a)を用いて、ヒト+SARS-CoV-2のゲノムおよびトランスクリプトームを作成し、NCBI参照配列NC_045512からのSARS-CoV-2配列に連結された代替染色体を持たないヒトゲノム配列バージョンhg38を含むfastaファイルを用いてアラインメントした。 2、およびNCBIのSARS-CoV-2遺伝子アノテーションに連結されたENSEMBLバージョンGRCh38.97のヒト遺伝子アノテーションを含むgtfファイル(http://hgdownload.soe.ucsc.edu/goldenPath/wuhCor1/bigZips/genes/)。ChimOutType Junctions SeparateSAMold WithinBAM HardClip ˶-chimScoreJunctionNonGTAG 0 ˶-alignSJstitchMismatchNmax -1-1 -1-1 ˶-chimSegmentMin 50 ˶-chimJunctionOverhangMin 50.

RNA-seq strandedness解析のために、SARS-CoV-2に感染したCalu3細胞のRNAを用いてRNA-seqデータを作成した。鎖状ライブラリは、Kapa mRNA HyperPrepキット(Roche; 08098115702)を用いて構築した。ライブラリーは、KAPA qPCR library quant kitを用いて、メーカーのプロトコルに従ってqPCRを行った。その後、qPCR濃度に基づいて、各レーンごとに等モル濃度のライブラリをプールした。プールされたライブラリは、イルミナのプロトコルを用いて変性させました。変性したライブラリーをHiSeq 2500(Illumina)にロードし、フラグメントの一端から120サイクルのシーケンスを行った。ベースコールは、イルミナ社のオフラインベースコール(OLB)を用いて行い、その後、デマルチプレックスを行った。GEOから、アクセッション番号GSE147507(50)(Calu3、SI付録、表S1)、GSE148697(58)(肺オルガノイド、SI付録、表S1)、GSE150316(60)(患者FFPE組織、SI付録、表S2)の公開RNA-seqデータ(鎖状ライブラリ)をダウンロードした。生のRNA-seqリードは、parameters-chimSegmentMin 30 ˶-chimJunctionOverhangMin 30を用いて上述のようにアラインメントし、キメラリードを呼び出した。上述のように、全ウイルスリードとヒト-ウイルスキメラリードを抽出した。BEDTools(73)のbamToBedユーティリティーを用いて、ウイルスリードのBAMファイルをBedファイルに変換した。その後、変換したBEDファイルのトータルリード数とストランドリード数をカウントした。

公開されているシングルセルRNA-seqデータは,GEOからアクセッション番号GSE145926(61)でダウンロードした(患者BALFサンプル,SI付録,表S3).バルク解析のために,生の fastq ファイル中の read1 (UMI) と read2 の配列が同じである重複リードを dedup_hash (https://github.com/mvdbeek/dedup_hash) で除去した.次に、chimSegmentMin 30 -chimJunctionOverhangMin 30というパラメータを用いて、上記のようにread2のプールをアラインメントし、キメラリードを呼び出した。また、リードの鎖状性を上記のように解析しました。単一細胞解析のために、Cell Ranger (10×Genomics Cell Ranger 3.0.2) (74) mkref を用いて、ENSEMBL リリース 93 (ftp://ftp.ensembl.org/pub/release-93/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz) のヒトゲノム配列を、SARS-CoV-2 配列 (GenBank ID. MN988713.1) に連結した fasta ファイルを用いて、カスタムゲノムを生成した。MN988713.1、およびヒトとウイルスのアノテーションを含むgtfファイルを使用しています。リードマッピング、リードのセルバーコードへの割り当て、PCRの重複の除去は、上述のカスタムゲノムを用いて、Cell Ranger(10×Genomics Cell Ranger 4.0.0)(74)カウントで行った。Seurat(バージョン3.2.2)(75)を用いてカウントを処理した。検出された遺伝子数が200未満の細胞や、ミトコンドリアに由来する転写産物の数が20%以上の細胞は削除した。各細胞について、ウイルスの正鎖または負鎖のいずれかにマッピングされたリードの数をカウントした。

データの提供
本研究で得られた知見を裏付けるすべてのデータは、論文および補足情報に掲載されています。本研究で生成されたすべてのシーケンスデータは、Sequence Read Archive, https://www.ncbi.nlm.nih.gov/sra に寄託されています(Accession No. PRJNA721333)。本研究で解析されたすべての発表データは、Materials and Methodsに記載されているアクセッションメソッドとともに本論文に引用されています。

謝辞
R.J.とR.A.Y.の研究室のメンバーをはじめ、ホワイトヘッド研究所やマサチューセッツ工科大学(MIT)の同僚の方々には、有益な議論やリソースを提供していただきました。ホワイトヘッド・ゲノミクス・コアのThomas Volkert氏とスタッフ、MIT/Koch Institute BioMicroセンターのStuart Levine氏には、シーケンシングのサポートをしていただきました。Tn5タグメンテーションを用いた統合型エンリッチメントシーケンスのプロトコルとアドバイスを提供してくれたLorenzo Bombardelli氏に感謝します。また、Jerold Chun氏、Inder Verma氏、Joseph Ecker氏、Daniel W. Bellott氏には議論や提案をいただきました。本研究は,NIHからR.J.への助成金(1U19AI131135-01; 5R01MH104610-21)と,Dewpoint TherapeuticsおよびJim Stoneからの寛大な贈り物によって支えられている。S.H.H.は,米国国立がん研究所のがん研究センターの学内研究プログラムの支援を受けました。最後に、インスピレーションを与えてくれたNathans Islandに感謝します。

脚注
1キーポイント Email: jaenisch@wi.mit.edu.
著者の貢献。L.Z., R.A.Y., R.J. が研究を設計し、L.Z. と A.R. が実験を行い、L.Z., A.R., M.I.B., S.H.H., R.A.Y., R.J. がデータを分析し、L.Z. と R.J. が全著者の意見を参考にして論文を執筆しました。

査読者 A.B.(オランダ癌研究所)、A.M.S.(フォックス・チェイス癌センター)。

競合他社の利益声明 R.J.はFate Therapeutics社、Fulcrum Therapeutics社、Omega Therapeutics社、Dewpoint Therapeutics社の顧問/共同創業者です。R.A.Y.はSyros Pharmaceuticals社、Camp4 Therapeutics社、Omega Therapeutics社、Dewpoint Therapeutics社の創業者であり株主です。

この記事には、https://www.pnas.org/lookup/suppl/doi:10.1073/pnas.2105968118/-/DCSupplemental に掲載されているサポート情報が含まれています。

Copyright © 2021 the Author(s). PNASに掲載されました。
This open access article is distributed under Creative Commons Attribution License 4.0 (CC BY).

参考文献
1.↵ 韓国疾病管理予防院、再陽性例の調査および分析結果。https://www.kdca.go.kr/board/board.es?mid=a30402000000&bid=0030. アクセスは2020年6月12日.Google Scholar
2.↵ J. Bullardら、診断用サンプルから感染性重症急性呼吸器症候群コロナウイルス2を予測する。Clin. Infect. Dis. 71, 2663-2666 (2020).Google Scholar
3.↵ X. Heら、COVID-19のウイルスシェディングと伝達性の時間的なダイナミクス。Nat. Med. 26, 672-675 (2020).CrossRef PubMed Google Scholar
4.↵ N. Li, X. Wang, T. Lv, Prolonged SARS-CoV-2 RNA shedding: Not a rare phenomenon. J. Med. Virol. 92, 2286-2287 (2020).Google Scholar
5.↵ M.J.Mina, R.Parker, D.B.Larremore, Rethinking COVID-19 test sensitivity-a strategy for containment. N. Engl. J. Med. 383, e120 (2020).CrossRef PubMed Google Scholar
6.↵ N. Sethuraman, S. S. Jeremiah, A. Ryo, Interpreting diagnostic tests for SARS-CoV-2. JAMA 323, 2249-2251 (2020).CrossRef PubMed Google Scholar
7.↵ J.-R. Yangら、SARS-CoV-2感染患者の回復期におけるウイルスRNAの持続的な陽性。J. Med. Virol. 92, 1681-1683 (2020).Google Scholar
8.↵ J. Anら、RNA検査で再検出可能な陽性を示したCOVID-19回復患者の臨床的特徴。Ann. Transl. Med. 8, 1084 (2020).Google Scholar
9.↵ D. Chenら、COVID-19におけるSARS-CoV-2 RNA陽性の再発。A case report. Int. J. Infect. Dis. 93, 297-299 (2020).CrossRef PubMed Google Scholar
10.↵ L. Lanら、COVID-19から回復した患者におけるRT-PCR検査の陽性結果。JAMA 323, 1502-1503 (2020).Google Scholar
11.↵ D. Loconsoleら、回復後のCOVID-19の再発。イタリアからの症例報告。Infection 48, 965-967 (2020).PubMed Google Scholar
12.↵ J. Luら、RT-PCRでSARS-CoV-2が再陽性となったCOVID-19患者の臨床的、免疫学的、ウイルス学的な特徴について。EBioMedicine 59, 102960 (2020).Google Scholar
13.↵ S. Luo, Y. Guo, X. Zhang, H. Xu, A follow-up study of recovery patients with COVID-19 in Wuhan, China. Int. J. Infect. Dis. 99, 408-409 (2020).CrossRef Google Scholar
14.↵ G. Yeら、重症急性呼吸器症候群コロナウイルス2再活性化の臨床的特徴。J. Infect. 80, e14-e17 (2020).CrossRef PubMed Google Scholar
15.↵ R. Wölfelら、COVID-2019を用いた入院患者のウイルス学的評価。Nature 581, 465-469 (2020).CrossRef PubMed Google Scholar
16.↵ M. Cevikら、SARS-CoV-2、SARS-CoV、およびMERS-CoVのウイルス量の動態、ウイルス排出期間、および感染性。A systematic review and meta-analysis. Lancet Microbe 2, e13-e22 (2021).Google Scholar
17.↵ A. L. Rasmussen, S. V. Popescu, SARS-CoV-2 transmission without symptoms. Science 371, 1206-1207 (2021).Abstract/FREE Full Text Google Scholar
18.↵ K. K. Toら、全ゲノム配列決定により確認された系統的に異なるSARS-コロナウイルス-2株によるCOVID-19再感染。Clin. Infect. Dis., doi:10.1093/cid/ciaa1275 (2020).CrossRef PubMed Google Scholar
19.↵ J. Huang ら、COVID-19 患者における SARS-CoV-2 PCR 陽性の再発。medRxiv [Preprint] (2020). https://doi.org/10.1101/2020.05.06.20089573 (Accessed 6 June 2020).Google Scholar
20.↵ B. Yuanら、医療隔離観察中に回復したCOVID-19患者におけるSARS-CoV-2ウイルスRNA陽性の再発。Sci. Rep. 10, 11887 (2020).CrossRef PubMed Google Scholar
21.↵ P. V'Kovski, A. Kratzel, S. Steiner, H. Stalder, V. Thiel, Coronavirus biology and replication: Implications for SARS-CoV-2. Nat. Rev. Microbiol. 19, 155-170 (2021).Google Scholar
22.↵ L. Alanagreh, F. Alzoughool, M. Atoum, The human coronavirus disease COVID-19: Its origin, characteristics, and insights into potential drugs and its mechanism. Pathogens 9, 331 (2020).Google Scholar
23.↵ E. de Wit, N. van Doremalen, D. Falzarano, V. J. Munster, SARS と MERS。Recent insights into emerging coronaviruses. Nat. Rev. Microbiol. 14, 523-534 (2016).CrossRef PubMed Google Scholar
24.↵ A.R.Fehr, S.Perlman, Coronaviruses: An overview of their replication and pathogenesis. Methods Mol. Biol. 1282, 1-23 (2015).CrossRef PubMed Google Scholar
25.↵ V. A. Belyi, A. J. Levine, A. M. Skalka, Unexpected inheritance: 脊椎動物のゲノムにおける古代のボルナウイルスおよびエボラウイルス/マールブルグウイルスの配列の複数の統合。PLoS Pathog. 6, e1001030 (2010).CrossRef PubMed Google Scholar
26.↵ M. Horie et al., 哺乳類ゲノム中の内因性非レトロウイルスRNAウイルス要素. Nature 463, 84-87 (2010).CrossRef PubMed Google Scholar
27.↵ 堀江美和子、友永健一、脊椎動物ゲノムにおける非レトロウイルスの化石。Viruses 3, 1836-1848 (2011).CrossRef PubMed Google Scholar
28.↵ A. Shimizu et al., Characterisation of cytoplasmic DNA complementary to non-retroviral RNA viruses in human cells. Sci. Rep. 4, 5074 (2014).CrossRef PubMed Google Scholar
29.↵ M. B. Geukingら、レトロトランスポゾンと外因性RNAウイルスの組み換えにより、非レトロウイルス性cDNAの統合が起こる。Science 323, 393-396 (2009).Abstract/FREE Full Text Google Scholar
30.↵ P. Klenerman, H. Hengartner, R. M. Zinkernagel, A non-retroviral RNA virus persists in DNA form. Nature 390, 298-301 (1997).CrossRef PubMed Google Scholar
31.↵ M. H. Lee らは、アルツハイマー病と正常な神経細胞における体細胞のAPP遺伝子の組み換え。Nature 563, 639-645 (2018).CrossRef PubMed Google Scholar
32.↵ C.R.Huang, K.H.Burns, J.D.Boeke, Active transposition in genomes. Annu. Rev. Genet. 46, 651-675 (2012).CrossRef PubMed Google Scholar
33.↵ H. H. Kazazian Jr, J. V. Moran, Mobile DNA in Health and Diseases. N. Engl. J. Med. 377, 361-370 (2017).CrossRef PubMed Google Scholar
34.↵ J. M. Coffin, H. Fan, 逆転写酵素の発見。Annu. Rev. Virol. 3, 29-51 (2016).Google Scholar
35.↵ M. De Cecco et al., L1 drives IFN in senescent cells and promotes age-associated inflammation. Nature 566, 73-78 (2019).Google Scholar
36.↵ B. Rodriguez-Martin et al.; PCAWG Structural Variation Working Group; PCAWG Consortium, Pan-cancer analysis of whole genomes identifies driver rearrangements promoted by LINE-1 retrotransposition. Nat. Genet. 52, 306-319 (2020).Google Scholar
37.↵ E. C. Scottらは、ホットなL1レトロトランスポゾンが体細胞の抑制を回避し、ヒト大腸癌を開始することを明らかにした。Genome Res. 26, 745-755 (2016).Abstract/FREE Full Text Google Scholar
38.↵ R. B. Jonesらは、LINE-1レトロトランスポゾン要素DNAはHIV-1感染細胞に蓄積する。J. Virol. 87, 13307-13320 (2013).Abstract/FREE Full Text Google Scholar
39.↵ M. G. Macchietto, R. A. Langlois, S. S. Shen, Virus-induced transposable element expression up-regulation in human and mouse host cells. Life Sci. Alliance 3, e201900536 (2020).Abstract/FREE Full Text Google Scholar
40.↵ Y. Yin, X. Z. Liu, X. He, L. Q. Zhou, 外因性コロナウイルスはヒト細胞において内因性レトロトランスポゾンと相互作用する。Front. Cell. Infect. Microbiol. 11, 609160 (2021).Google Scholar
41.↵ H. Kaessmann, N. Vinckenbosch, M. Long, RNAベースの遺伝子複製。Mechanistic and evolutionary insights. Nat. Rev. Genet. 10, 19-31 (2009).CrossRef PubMed Google Scholar
42.↵ S. Lanciano, G. Cristofari, Measuring and interpreting transposable element expression. Nat. Rev. Genet. 21, 721-736 (2020).Google Scholar
43.↵ T. A. Morrish et al., DNA repair mediated by endonuclease-independent LINE-1 retrotransposition. Nat. Genet. 31, 159-165 (2002).CrossRef PubMed Google Scholar
44.↵ J. C. Venter ら、ヒトゲノムの配列。Science 291, 1304-1351 (2001).Abstract/FREE Full Text Google Scholar
45.↵ T. Sultana et al., ヒトゲノムにおけるL1レトロトランスポゾンのランドスケープは、挿入前の配列バイアスと挿入後の選択によって形成されている。Mol. Cell 74, 555-570.e7 (2019).CrossRef Google Scholar
46.↵ D. A. Flaschら, Genome-wide de novo L1 retrotransposition connects endonuclease activity with replication. Cell 177, 837-851.e28 (2019).Google Scholar
47.↵ D. L. Stern, Tagmentation-based mapping (TagMap) of mobile DNA genomic insertion sites. bioRxiv [Preprint] (2017). https://doi.org/10.1101/037762 (Accessed 16 February 2021).Google Scholar
48.↵ S. Picelliら、Tn5 transposase and tagmentation procedures for massively scaled sequencing projects. Genome Res. 24, 2033-2040 (2014).Abstract/FREE Full Text Google Scholar
49.↵ L. Zhang et al., SARS-CoV-2 RNA reverse-transcribed and integrated into the human genome. bioRxiv [Preprint] (2020). https://doi.org/10.1101/2020.12.12.422516 (Accessed 16 March 2021).Google Scholar
50.↵ D. Blanco-Melo et al., Imbalanced host response to SARS-CoV-2 drives development of COVID-19. Cell 181, 1036-1045.e9 (2020).CrossRef PubMed Google Scholar
51.↵ J. Huangら、多能性幹細胞由来のヒト肺肺胞2型細胞へのSARS-CoV-2感染は、急速な上皮内在性炎症反応を誘発する。Cell Stem Cell 27, 962-973.e7 (2020).Google Scholar
52.↵ J. A. Perez-Bermejo et al., SARS-CoV-2 infection of human iPSC-derived cardiac cells reflect cytopathic features in hearts of patients with COVID-19. Sci. Transl. Med.、doi:10.1126/scitranslmed.abf7872 (2021).FREE Full Text Google Scholar
53.↵ F. Jacobら、ヒト多能性幹細胞由来の神経細胞と脳オルガノイドは、SARS-CoV-2の神経栄養が脈絡叢上皮で優勢であることを明らかにした。Cell Stem Cell 27, 937-950.e9 (2020).Google Scholar
54.↵ G. G. Giobbe et al., SARS-CoV-2 infection and replication in human fetal and pediatric gastric organoids. bioRxiv [Preprint] (2020). https://doi.org/10.1101/2020.06.24.167049 (Accessed 28 October 2020).Google Scholar
55.↵ S. E. Gill et al., Transcriptional profiling of leukocytes in critically ill COVID19 patients: インターフェロン反応と血液凝固への影響。Intensive Care Med. Exp. 8, 75 (2020).Google Scholar
56.↵ D. Kim et al., The architecture of SARS-CoV-2 transcriptome. Cell 181, 914-921.e10 (2020).CrossRef PubMed Google Scholar
57.↵ B. Yan ら、SARS-CoV2 感染細胞における宿主とウイルスのキメライベントは、まれで人工的なものである。 bioRxiv [Preprint] (2021). https://doi.org/10.1101/2021.02.17.431704 (Accessed 20 February 2021).Google Scholar
58.↵ Y. Hanら、hPSC-derived lung organoidsを用いたCOVID-19治療薬候補の同定。bioRxiv [Preprint] (2020). https://doi.org/10.1101/2020.05.05.079095 (Accessed 10 March 2021).Google Scholar
59.↵ S. Alexandersen, A. Chamings, T. R. Bhatta, SARS-CoV-2 genomic and subgenomic RNAs in diagnostic samples are not an indicator of active replication. Nat. Commun. 11, 6059 (2020).CrossRef PubMed Google Scholar
60.↵ N. Desai et al., Temporal and spatial heterogeneity of host response to SARS-CoV-2 pulmonary infection. Nat. Commun. 11, 6319 (2020).Google Scholar
61.↵ M. Liao et al., COVID-19患者における気管支肺胞免疫細胞のSingle-cell landscape. Nat. Med. 26, 842-844 (2020).PubMed Google Scholar
62.↵ M. C. Dalakas, Guillain-Barré 症候群: COVID-19が引き金となった最初の自己免疫性神経疾患として記録されました。筋ジストロフィーは今後も続くでしょう。Neurol. Neuroimmunol. Neuroinflamm. 7, e781 (2020).Abstract/FREE Full Text Google Scholar
63.↵ S. Pfeufferらは、選択的IgA欠損症におけるSARS-CoV-2感染症に合併する自己免疫。Neurol. Neuroimmunol. Neuroinflamm. 7, e881 (2020).FREE Full Text Google Scholar
64.↵ A. Baumら、REGN-COV2抗体はアカゲザルとハムスターのSARS-CoV-2感染を予防・治療する。Science 370, 1110-1115 (2020).Abstract/FREE Full Text Google Scholar
65.↵ B. J. Wagstaff, M. Barnerssoi, A. M. Roy-Engel, Evolutionary conservation of the functional modularity of primate and murine LINE-1 elements. PLoS One 6, e19672 (2011).CrossRef PubMed Google Scholar
66.↵ E.A.Farkash, G.D.Kao, S.R.Horman, E.T.Prak, ガンマ線は培養細胞アッセイにおいてエンドヌクレアーゼ依存性のL1レトロトランスポジションを増加させる。Nucleic Acids Res. 34, 1196-1204 (2006).CrossRef PubMed Google Scholar
67.↵WHO, World Health Organization (WHO) resource of in-house-developed molecular assays. https://www.who.int/docs/default-source/coronaviruse/whoinhouseassays.pdf?sfvrsn=de3a76aa_2. アクセスは2020年6月6日.Google Scholar
68.↵ H. Li, Minimap2: Pairwise alignment for nucleotide sequences. Bioinformatics 34, 3094-3100 (2018).CrossRef PubMed Google Scholar
69.↵ W. J. Kent, BLAT-the BLAST-like alignment tool. Genome Res. 12, 656-664 (2002).Abstract/FREE Full Text Google Scholar
70.↵ A. Dobin et al., STAR: Ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21 (2013).CrossRef PubMed Google Scholar
71.↵ H. Li et al.; 1000 Genome Project Data Processing Subgroup, The sequence alignment/map format and SAMtools. Bioinformatics 25, 2078-2079 (2009).CrossRef PubMed Google Scholar
72.↵ F. Ramírez et al., deepTools2: A next generation web server for deep-sequencing data analysis. Nucleic Acids Res. 44, W160-W165 (2016).CrossRef PubMed Google Scholar
73.↵ A.R.Quinlan, I.M.Hall, BEDTools: A flexible suite of utilities for comparison genomic features. Bioinformatics 26, 841-842 (2010).CrossRef PubMed Google Scholar
74.↵ G. X. Zheng et al., Massively parallel digital transcriptional profiling of single cell. Nat. Commun. 8, 14049 (2017).CrossRef PubMed Google Scholar
75.↵ T. Stuart et al., Comprehensive integration of single-cell data. Cell 177, 1888-1902.e21 (2019).CrossRef PubMed Google Scholar


元論文 : https://www.pnas.org/content/118/21/e2105968118

#コロナ #ワクチン

この記事が気に入ったらサポートをしてみませんか?