見出し画像

新型コロナウイルスのゲノム解析により、人工的な編集から生じる「指紋」を確認。研究室で作成された可能性が極めて高い


(記事タイトル)
Endonuclease fingerprint indicates a synthetic origin of SARS-CoV-2
エンドヌクレアーゼ・フィンガープリントからSARS-CoV-2の合成起源が判明
著者:Valentin Bruttel

【 解説 】
ゲノムの解析により、新型コロナウイルスには、In vitroゲノムアセンブリ(IVGA)法により編集された際に残る形跡「指紋」が複数見つかったということです。

「SARS-CoV-2は試験管内で組み立てられた感染性クローンとして発生した可能性が高いことを報告する」
近縁種からの突然変異で自然発生したと言う可能性は非常に低いという結論です。


以下、本文の翻訳。

要旨

SARS-CoV-2が動物から人へ直接伝播したのか、あるいは実験室の事故で間接的に伝播したのかを理解することは、将来のパンデミックを防ぐために重要なことである。
SARS-COV-2のゲノムには、合成ウイルスに特有の制限酵素認識部位があり、効率的にゲノムを分解・再構成することが可能である。
SARS-COV-2には、このような制限酵素認識部位が存在し、合成ウイルスに特徴的なゲノムの分解・再構成が可能であることがわかった。
SARS-CoV-2は、自然進化というよりも合成ゲノムの産物である可能性が高い異常なウイルスであることがわかった。
SARS-CoV-2の制限地図は、これまでに報告された多くの合成コロナウイルスゲノムと一致し、効率的な逆遺伝学システムに必要なすべての条件を満たしている。
また、これらの合成に見える認識部位における同義語変異の割合が著しく高く、近縁種から進化したとは考えられない合成指紋を持っていることが近縁種との相違点である
SARS-CoV-2は試験管内で組み立てられた感染性クローンとして発生した可能性が高いことを報告する。

概要

研究室内で天然コロナウイルスの合成変異体を構築するために、研究者はしばしばin vitroゲノムアセンブリと呼ばれる方法を用いている。この方法では、制限酵素と呼ばれる特殊な酵素を利用してDNAビルディングブロックを生成し、それをウイルスゲノムの正しい順番に「縫い合わせる」ことができる。
研究室でウイルスを作る場合、研究者は通常、制限部位と呼ばれる縫合部位を追加したり削除したりして、ウイルスゲノムを改変する。研究者がこれらの部位をどのように変更するかによって、試験管内ゲノムの組み立て状態を示す指紋のようなものが得られる。

私たちは、SARS-CoVが合成ウイルスに典型的な制限部位のフィンガープリントを持つことを発見した。SARS-CoV-2の合成指紋は、野生のコロナウイルスでは異常であり、実験室で組み立てられたウイルスでは一般的なものである。
SARS-CoV-2の制限部位を区別するタイプの変異(同義またはサイレント変異)は工学的に特徴的であり、制限部位にこれらのサイレント変異が集中していることはランダム進化によって生じたとは極めて考えにくい。
制限部位のフィンガープリントとそれを生み出す変異のパターンは、いずれも野生のコロナウイルスでは極めて稀であり、合成ウイルスではほぼ普遍的である。
この結果は、SARS-CoV2が合成ウイルスに由来することを強く示唆するものである。

はじめに

2019年末にSARS-CoV-2が出現してからわずか2年で、世界で600万人近くのCOVID-19による死亡が確認された。超過死亡の分析では、2021年12月までに1800万人が命を落としたと推定されています(Wang et al.2022)。SARS-CoV-2の起源を理解することは、管理者が将来のパンデミックを防ぐための政策や研究の優先順位付けに役立つ。

現在、SARS-CoV-2の起源については2つの仮説がある。第一の仮説は、SARS-CoV-2が自然起源で、華南の海鮮市場で動物から人へ流出したと仮定している(Pekar et al.) 華南海鮮市場起源を支持する研究は、華南海鮮市場がCOVID-19パンデミックの初期の震源地であったことを示唆する初期の発生データの分析に依存している。
しかし、初期の症例報告や系統力学の解析は、初期の症例データに関する仮定に敏感である。このような研究は、症例がランダムに確認されることを前提としていますが、保健当局は初期の流行を食い止めるために大規模な接触者追跡と場所追跡を行い、水産物市場との関連が初期の症例定義の一部として含まれていました (Washburne et al. 2022年)。
その結果、ウェットマーケットは感染の場であったと考えられているが、それが波及の場であることは決定的には示されていない。

SARS-CoV-2の起源に関する第2の仮説は、SARS-CoV-2がコロナウイルス(CoV)の研究の結果として研究室で発生したと仮定するものである。
この仮説では、CoVの研究が武漢で行われたこと、SARS-CoV-2はサルボウイルスとしては珍しく、Spikeタンパク質のS1サブユニットとS2サブユニットの間にFurin切断部位(FCS)を持つことが主に指摘されています。インビトロ研究により、FCSがSARS-CoV-2の病原性の鍵を握っていることがわかった(Johnson et al. 2021)。FCSは、SARS-CoV-2がパンデミックを引き起こした一方で、毎年推定66000件のサーベコウイルス流出(Sánchez et al. 2022)がそうではない理由を説明するかもしれない。SARS-CoV-2のFCSは、ヒトの上皮性Naチャネル遺伝子であるα-ENaCに見られるものと非常に類似しており(Anandら2020;Harrison and Sachs 2022)、動物宿主で進化したサルベコウィルスとしては珍しいと思われる。
しかし、ヒトに似たENaCは、ラッキーアラインメント、ヒト以外のα-ENaC、スピルオーバー後の組み換えによるα-ENaCの獲得など、複数の説明と整合性がある。これらの2つの仮説を区別し、SARS-CoV-2の起源を知るためには、より多くの証拠が必要である。

COVID-19のパンデミック以前には、多くのウイルス学的研究プロジェクトが、自然発生するCoVがヒトでパンデミックを起こすのにどれだけ近いかを調べていた。
研究者は、Furin切断部位を生成する小さな変化を導入したり(Liら、2015)、異なる受容体結合ドメイン(RBD)で実験したり(Huら、2017)、さまざまな実験によってウイルスの遺伝子型とヒトへの感染性表現型の関係を探ることになります。
このような実験には、感染性クローンを作る必要があり、それにはin vitroで全長ウイルスDNAゲノムを組み立てる必要があります。

In vitroゲノムアセンブリ(IVGA)は、伝達性胃腸炎ウイルス(Yountら2000)、MERS(Scobeyら2013)、SARS(Yountら2003)、コウモリコロナウイルス(Zengら2016)など、多くのコロナウイルスの逆遺伝子系の作成に使用されています。

本論文では、RNAウイルス感染性クローンのIVGAの一般的な方法を検討する。我々は、研究者が歴史的にIVGAのためにウイルスゲノムをどのように改変してきたかについて、特定のパターンを記録する。我々は、SARS-CoV-2にこの特異的なパターンを見出した。SARS-CoV-2の制限地図がIVGAのすべての基準を満たしているかどうかを調べ、野生型CoVで観察されるパターンの確率と、SARS-CoV-2の近縁種からそのパターンが進化する確率を推定している。

研究成果

この論文の目的は、SARS-CoV-2が動物からヒトへの流出から生まれたのか、それとも実験室で行われた実験から生まれたのか、という問題に取り組むことである。後者のシナリオでは、一般的な実験室の技術によってウイルスゲノムが操作された証拠が存在する可能性がある。
SARS-CoV-2は大きなRNAウイルスである。CoVの感染性バージョンを作るために、30kbのRNAゲノム全体がin vitroゲノムアセンブリ(IVGA)によりDNA中に再構築される。IVGAは、20年以上にわたって、改変型およびキメラ型RNAウイルスの逆遺伝子システムの構築に用いられてきた(Yount et al, 2000)。
最も重要なことは、IVGA法は遺伝的指紋を残すことができるということであり、我々はSARS-CoV-2のゲノムにその指紋を見出した。

In vitroゲノムアセンブリの方法と制約

野生のコロナウイルスから感染性クローンを作るには、ウイルスゲノムの完全長DNAコピーを合成する必要がある。コロナウイルスのゲノムは約30Kbの長さである。このような大きなDNA配列を作るには、より小さなDNA断片を組み立てて、より大きな完全長ウイルスゲノムを作る必要がある。制限酵素は、酵素の認識配列の外側を切断し、DNA断片を切断して、3-4ヌクレオチドのオーバーハングと粘着性のある末端を残し、DNA断片を正しい順序で確実に再集合させることができる(図1)。
完全長ゲノムは、完全長cDNAを組み立てる前に、細菌人工染色体(BAC)に組み入れるか、断片をプラスミドに別々に保存することができる(Almazán et al.2014)。

図 1:合成 RNA ウイルスの組み立て。 30kb程度のCoVゲノムの直接アセンブリーには、いくつかの設計上の考慮点がある。 A) 複数の同一のII型酵素を直接ゲノムアセンブリに使用することはできない。すべての接合部に対して認識配列を切断する異なるII型酵素を使用する場合、多数のバッファーを使用し、異なる温度で多数の反応を行う必要があり、ゲノム中の多数の認識部位を変更する必要がある可能性がある。より少ない種類の酵素を使用することが望ましい。B) 認識配列の外側を切断するエンドヌクレアーゼ(タイプIIシフトまたはタイプIIS)は、複雑なウイルスゲノムの指向性アセンブリを可能にする明確なスティッキーエンドを生成することができる。C) IVGAでは、PCRまたはDNA合成から得られた個々の断片を、まず細菌プラスミドで増幅する。D) IISエンドヌクレアーゼを用いて、プラスミドから断片を切り出す。E) 各断片のユニークな粘着末端により、完全長cDNAまたは細菌性人工染色体への指向性アセンブリが可能となる。F) 興味のある領域(ROI)に隣接する部位で異なるタイプIISエンドヌクレアーゼを使用することにより、その領域の効率的な置換が可能である。G) この方法は、ウイルスのタンパク質を変化させない。しかし、合成アセンブリに使用したエンドヌクレアーゼのIIS認識部位が規則正しく並んでいる明確なパターン(フィンガープリント)が残る。

IVGAは、ウイルスゲノムの異なるセグメントを容易に改変し、新規ウイルス遺伝子型の表現型を研究するためにキメラコロナウイルスを作成するための効率的な逆遺伝子システムを作成するために使用されている(Cockrell et al.2017; Zhang et al.2020; Messer et al.2012; Donaldson et al.2008; Donaldson et al.2008). 野生型CoVから逆遺伝システムを作るには、30kbのコロナウイルスゲノムを5〜8個の断片に分割し、それぞれが通常8kbより短くする必要がある(Almazán et al. 2006; Becker et al. 2008; Scobey et al. 2013; Zeng et al. 2016; Cockrell et al. 2017; Hu et al. 2017)。
逆遺伝子システムを設計するために、研究者はしばしば、得られる感染性クローンの適合性に大きな影響を与えることなく制限酵素認識部位を変更する同義変異を導入することによって、野生型ウイルスゲノムから合成DNA構築物を修正する。

野生型ゲノムに制限部位を追加したり削除したりして、合成ウイルスゲノムをいくつかのDNAセグメントに分割し、全長ゲノムを組み立てる前に、それぞれ個別に変異させることができる。研究者はゲノム全体に制限部位をランダムに配置することもできるが、研究目標を達成し、IVGAの制約を満たすために、制限マップを規則正しく修正する傾向がある。
より少ない断片で作業することは容易であるが、効率的な断片生成のためには、すべての断片が長すぎないことが必要である。このようなプロトコルの制約により、制限部位の数を最小限に抑え、制限部位の数から予想されるよりも短い最大フラグメント長を作り出すために、制限部位が規則的に配置されることになる。
再集合されたゲノムには通常傷跡がないが、感染性クローン研究の物流上の制約から、制限部位が規則正しく配置され、最大長の断片が比較的小さくなり、この両者が感染性クローンのゲノムにおけるIVGAの指紋となるのである。

制限部位の正確な修飾は、研究目標を促進するために選択されます。2017年の発表では、他のウイルスからのスパイク遺伝子を効率的に導入できるように、コウモリのCoV(WIV1)に2つのBsaI部位を導入しました(Hu et al 2017)。研究者は、ゲノムアセンブリに2つの異なるエンドヌクレアーゼを使用し、1つの酵素の2つの部位が目的の領域を挟み、各バリアントのためにウイルスバックボーン全体を再アセンブリすることなく、フランキング領域の効率的な操作を可能にしました。
2008年の論文では、新しいSARS様ウイルス逆遺伝子システムの制限部位が、SARS逆遺伝子システムの制限部位と一致することが報告されている(Becker et al 2008)。このことから、2つのシステム間で効率的にセグメントを置換することが可能であると考えられる。

合成ウイルスの制限部位マップには、以下のようなIVGAのフィンガープリントが観察される。

  • ユニークなエンドヌクレアーゼ(BsaI、BsmBI、BglI)の導入および/または欠失。

  • 選択した酵素で消化すると、5-8個の断片ができる。

  • 最大の断片は8kb以下である。

  • すべてのスティッキーエンドはユニークでなければならない。

  • すべての認識部位は同義性突然変異で作られる。

  • 2つのユニークな認識部位は、さらに操作されることを意図した領域に隣接している場合がある。

  • 認識部位は、セグメント置換を可能にするために、他のウイルスと整列させることができる。

IVGAのゲノム上の特徴

このような技術的な制約や設計上の配慮が、どのように異なるIVGAの特徴につながるかを調べるため、まず、非修飾ウイルスに予想される制限部位のランダム分布を計算した。これは、広範囲の天然コロナウイルスゲノムを包括的な制限酵素セットでインシリコ消化し、断片数の関数として最大断片長の規則的な「野生型分布」を得ることにより行われる。IVGAのゲノムシグネチャーには、野生型分布の特定のタイプの異常値が含まれています。

2013年、研究者は組換えMERSコロナウイルスを構築しました(Scobey et al.2013)。野生型ウイルスは、不便な場所にいくつかのBglIサイトがあり、効率的な組み立てに適していませんでした。IVGAのための理想的なMERS-CoV逆遺伝子システムを構築するために、研究者は既存のBglIサイトを削除し、さらに6つのBglIサイトを等間隔で挿入しました。
すべての追加/削除は同義語変異によって行われ、7つの断片が作られた。そのうちの最長は5721bpで、30kbのMERSゲノムの19%の長さである(図2A)。野生型の分布では、7つの断片を作る消化のための最長セグメントの平均長は、ゲノムの40%であった。IVGAのためにMERS-CoVを設計した研究者は、等間隔に配置されたタイプIIS制限部位を探し、野生型のランダム消化と比較して異常に短い最長断片のフィンガープリントを残している。

図2:in vitroゲノムアセンブリの制限部位フィンガープリント (A)野生型ゲノムと比較すると、IVGA用に設計されたMERSウイルス、iMERS-CoVは、(B)同様に設計されたコウモリCoV、iWIV1と同様に制限部位が等間隔である。 C)試験管内で組み立てられたウイルスは、特定できる方法で野生型分布(灰色の箱型)から逸脱している。研究目的や研究所の物流上の制約から、cDNAクローンの組み立てに使用される最長断片は、野生型分布から予想されるよりもかなり短く、断片の数も少ないままであることが多い(5-8)。ゲノムの複雑な制約をコントロールするために、幅広い非エンジニアリングCoVゲノムを大規模なエンドヌクレアーゼで消化して、最長フラグメント長の野生型分布を推定している。

同じパターンは、改良型SARS様コロナウイルスでも見ることができます。2016年、コウモリサルベコウィルスWIV1(iWIV1)の組換え変異体を工学的に解析した研究者は、3つの既存のBglIサイトを利用し、1つの既存のBglIサイトを削除し、4つの新しいBglIサイトを導入し、すべて同義変異によって行った(Zeng et al.2016)。iWIV1は8つの断片から組み立てられ、最大断片長は5451bpだった(図2B)。野生型分布のもとでは、8つのフラグメントが得られる制限消化による平均最長フラグメント長は、ウイルスゲノムの長さの37%であった。iWIV1のInfectiousクローンは、iMERS-CoVと同様に、BglI消化による最長断片が異常に短いことが確認された。

IVGAのタイプIIS部位の追加/削除の効果を図2Cに示す。野生型の分布を用いて、天然のCoVでこのような異常に短い最長断片長が見つかる可能性を推定している。SARS-CoV-2の出現以前にIVGAに用いられた効率的な逆遺伝子システムは、断片の数の範囲が狭く、最長断片長が野生型分布から予想されるよりもかなり短いIIS制限マップを有している。
SARS-CoVに対するBsaI/BsmBIの生物工学的有用性

CoVsの初期のIVGAアプローチに使用された最も一般的な制限酵素はBglIでした(Yount et al. 2003; Scobey et al. 2013; Becker et al. 2008; Yount et al. 2000; Zeng et al. 2016)。しかし、MERSとSARSはゲノム内に複数の適切な位置にBglIサイトを持つが、近縁種のSARS-CoV-2はゲノムの先頭に近い不便な場所に1つだけ保存されたBglIサイトを持つ(図S1)。また、BglIは3ntのオーバーハングしか作らないが、IISエンドヌクレアーゼは4ntのオーバーハングを作ることができ、ユニークである確率が高く、組換えウイルスをより確実に組み立てることができる。IVGAに使用されるIIS型エンドヌクレアーゼには、BsaIとBsmBI/Esp3Iがある(Donaldson et al.) ここではBsmBIにのみ言及する(IIS型酵素に関するコメントは表S1参照)。サルベドウイルスは、高度に保存されたBsaI/BsmBI制限部位の豊富なセットを含んでおり、天然コロナウイルスの広い系統的範囲にわたってキメラCoVを作成するために使用することができる(図3B)。キメラコロナウイルスの研究に熱心な生物工学者にとって、BsaI/BsmBIは、天然のSARS-CoV-2関連ウイルスから柔軟な逆遺伝学システムを作り出すのに理想的な組み合わせであろう。複数の比較で力を失うことを避けるために、我々はSARS-CoV-2のBsaI/BsmBI部位に分析を集中し、SARS-CoV-2のBsaI/BsmBIマップを我々の分析で使用した他の全てのCoVの制限マップと比較した。

図3. (A)近縁種からSARS-CoV-2 BsaI/BsmBI制限地図の作り方。(B) SARSコロナウイルスのBsaI/BsmBI制限地図。SARS-CoV-2の制限部位は、他のSARS COVと比較するために縦の破線で示した。近縁のウイルスの同じ位置にあるIIS部位は、キメラCoVを研究するためにウイルス断片の効率的な置換を可能にする。S1領域とRBDを挟む2つのBsaIサイトにより、受容体結合ドメインの効率的な置換やS1/S2接合部へのFCSの導入が可能となる。(C) グレーの箱ひげ図は、本研究で得られたすべてのCoVとすべての制限酵素による最長断片長の経験的なヌル分布を示す。色のついた点は、SARS-CoV-2と同様に、既知のコロナウイルス逆遺伝子系の最長断片長を示している。SARS-CoV-2および他のCoV逆遺伝子系はすべて、IVGAの最長断片長を短縮しようとする研究者の期待値(null)を下回っている。(D)CoV逆遺伝子システムの理想的な範囲である5-7フラグメントを作るすべての消化物のzスコアの順位プロット。zスコアは、フラグメントの数を補正して、野生型の期待値より低い標準偏差を測定する。SARS-CoV-2は、いくつかの既知のCoV逆遺伝子システムよりもIVGAのために設計された可能性が高いようである。

SARS-CoV-2のBsaI/BsmBIフィンガープリントは、試験管内起源の可能性が高いことを示している

SARS-CoV-2ゲノムには5つのBsaI/BsmBI部位がある(Fig 3A)。そのBsaI/BsmBIマップは、近縁種とは対照的に、等間隔であり、他のほぼすべての系統のB型サルボウイルスに見られる2つの高度保存BsaI部位がない(図2および図3B)。
SARS-CoV-2のBsaI/BsmBI制限マップは、S1/S2接合部にFurin切断部位を導入するなど、受容体結合ドメインの効率的な改変を可能にし、これらの保存認識部位を共有する近縁ウイルスのセグメントと置換することを可能にするものであろう。

SARS-CoV-2のBsaI/BsmBI消化による最長断片長は7578 bpで、ゲノムの25%の長さである。野生型では、6フラグメント消化による平均最長フラグメント長はウイルスゲノムの43%であった(Fig. 3C)。SARS-CoV-2のBsaI/BsmBI制限マップは、非工作CoVの最長断片長の下位1%の異常値であり、以前に発表されたコロナウイルス感染クローンの観察結果と一致する(Fig 3C)。5-7個の断片を生成するすべてのCoV制限地図の中で、SARS-CoV-2のBsaI/BsmBI地図は、公表された10種類のIISで組み立てられたCoV感染クローンのうち3種類よりも野生型予想より標準偏差が低い(Fig. 3D)。6-7ntの認識配列と3-4ntのオーバーハングを持つタイプIIS酵素のみに野生型の分布を限定すると、1,491のCoVタイプIIS消化物が5-7フラグメントという理想的な範囲に収まることがわかった。タイプIIS野生型分布の1,491の制限マップのうち、SARS-CoV-2は、我々が見つけたどの非設計ウイルスよりも平均より標準偏差が小さく、非設計野生型ウイルスでこのように高いzスコアを持つ異常な制限マップを観察するチャンスが0.07%以下であることを示唆している (Fig S2).

6 ntの認識部位を持つIIS制限酵素によるCoVのランダム消化および二重消化では、中央値で14の断片が得られ、これらの野生型消化のうち理想的な5-7の範囲に入ったのは12.5%だけであった。SARS-CoV-2は二重消化で6個の断片を持つ。その近縁種は5個(BANAL52)および7個(RaTG13)の断片を持ち、制限部位が明確である(図3A)。

IVGAクローニングでは、タイプIIs消化による粘着末端はすべてユニークでなければならない。SARS-CoV-2のBsaI/BsmBI消化からの5つの4ntオーバーハングは全てユニークであり、非パリンドロミックである。BsaI/BsmBI部位を変更する全ての変異は、理想的な感染性クローンのためにサイレントでなければならない。RaTG13のBsaI/BsmBI部位とSARS-CoV-2を分離する12の変異はすべてサイレントであり、BANAL-52とSARS-CoV-2のBsaI/BsmBI部位間の5つの変異はすべてサイレントである。
これら2つの近縁種の間では、14の異なるサイレント変異がSARS-CoV-2のBsaI/BsmBI制限部位を近縁種のそれとは分けている。RaTG13 (P=9×10-8; OR=8.9; 95% CI: 4.2-17.3) とBANAL52 (P=0.004; OR=5.2; 95% CI: 1.6-13.3) の両方で、他のウイルスゲノムのサイレント変異の割合と比較してBsaI/BsmBI認識部位内に有意に高いサイレント変異の割合が存在することが明らかになった。

変異解析

RaTG13とBANAl-20-52の両方について、10万個のランダムなin silico突然変異体が生成された。置換の数は各ゲノムのSARS-CoV-2からのヌクレオチドの違いに等しく、置換された特定のヌクレオチドは3つのゲノム全体のヌクレオチド頻度に比例して抽選された。変異体はin silicoで消化され、断片の数と最長断片の長さが抽出され、z-スコアが計算された。RaTG13変異体の1.2%だけが、SARS-CoV-2よりも大きなzスコアを持つBsaI/BsmBI制限マップをもたらした。
BANAL52は、SARS-CoV-2と200塩基以上の差がある近縁種ですが、SARS-CoV-2と同等かそれ以上のzスコアを得た変異体は、わずか0.1%でした。このような理想的な逆遺伝子システムは、SARS-CoV-2の近縁種から偶然に進化したとは考えにくい(図4)。

図4:BANAL52とRaTG13の変異解析。 (A) RaTG13とBANAL-20-52のゲノムをランダムに変異させ、BsaI/BsmBIでインシリコ消化し、自然変異がSARS-CoV-2と同等かそれ以上のIVGAに適した感染性クローンを生成する確率を推定している。(B)RaTG13が変異してSARS-CoV-2より大きなz-スコアを持つ確率は1.2%であり、BANAL52が変異してSARS-CoV-2より大きなz-スコアを持つ確率は0.1%であることが分かった。

SARS-CoV-2とBANAL-20-52との間のBsaI/BsmBI部位の各変化は、ウォブルヌクレオチドにおける単一の同義変異によって引き起こされ、これはまさに、上述の公開研究においてかかる変化がなされた方法である。偶然に5つのウォブル変異を得る複合オッズは非常に低いと思われるが(表S3)、オッズの確実な推定には、可能性のある部位の空間を考慮し、文献におけるウォブル変異率を注意深く調べる必要があるので、この課題は今後の研究に委ねられる。

結論

SARS-CoV-2のBsaI/BsmBIマップは、野生コロナウイルスとしては異常であり、効率的な逆遺伝学システムとして設計された感染性クローンに由来する可能性がより高い。
感染性クローン技術の研究目標と実験室のロジスティックスは、感染性クローンのゲノムにこれまで報告されていない指紋を残す可能性がある。このような制約の結果、発表された感染性クローンの最長断片長は、様々な制限酵素で消化された天然のCoVのそれよりもかなり短いものとなっている。SARS-CoV-2のBsaI/BsmBI制限地図の最長断片は、分析したすべての制限地図の最長断片の下位1%に位置している。SARS-CoV-2のBsaI/BsmBI消化による最長断片は、我々の分析でIVGAに適したタイプIIS酵素で消化した他のどの非エンジニアリングCoVよりも、野生型の期待値より標準偏差が低い。BsaI/BsmBIで消化した場合、SARS-CoV-2は6個の断片を生成し、逆遺伝子システムの理想的な範囲に収まる。
BsaI/BsmBI消化によるオーバーハングは、効率的で忠実なラボアッセンブリーのためのすべての要件を満たしている。SARS-CoV-2とその近縁種を分けるすべてのBsaI/BsmBI部位は、専ら同義変異によって異なっており、BsaI/BsmBI部位内の同義変異の割合は、ウイルスゲノムの残りの部分よりも著しく高い。SARS-CoV-2のBsaI/BsmBI制限地図は、どの野生型コロナウイルスとも異なっており、その近縁種から進化したとは考えにくい。このことは、SARS-CoV-2が逆遺伝学システムから発生した可能性が高いことを示している。

我々が発見した証拠は、SARS-CoV-2の研究室起源を示唆する他のゲノム上の証拠、例えば、SARS-CoV-2に見られるが他の既知のサルベドウイルスには見られないフリン切断部位(FCS)とは独立したものであった。しかし、SARS-COV-2のBsaI部位はS1遺伝子とS1/S2接合部を挟んでおり、同様のデザインはこの領域での置換に以前から用いられていたものである。また、制限地図だけでは起源のラボを示すことはできない。

SARS-CoV-2がリバースジェネティクスシステムであるという我々の仮説は検証可能である。関連する研究者によって収集され研究されたすべてのCoVのデータベースは、SARS-CoV-2の子孫は既知の研究室には存在しないことを示すかもしれない。
COVID-19パンデミックの推定開始日である2019年11月までの研究室ノートから、コウモリCoVのBsaI/BsmBI改変がないことが判明するかもしれない。同じまたは中間のBsaI/BsmBI制限地図を持つSARS-CoV-2の前駆ゲノムが野生で見つかった場合、この異常な制限地図が偶然に進化した可能性が高くなる可能性がある。

我々の解析にはいくつかの限界がある。我々のメタ解析は、人工CoVの代表的なセットを探し、ここで研究した特定の方法を用いて、特定の文献をターゲットにした用語を検索した。他の用語、文献、同じ方法を他のウイルスに適用することで、IVGAのフィンガープリントの理解を深めることができるかもしれない。
さらに、我々の野生型分布は、New England Biosciencesで販売されている70種類の非SARS-COV-2ゲノムと214種類の制限酵素を幅広く利用しているが、解析をIIS型酵素のみに制限することで、SARS-CoV-2はシフトした野生型分布からさらに大きな外れ値となった。
さらにCoVゲノムを追加し、認識部位のヌル分布に関する今後の研究により、野生型分布の理解が深まり、SARS-CoV-2のBsaI/BsmBI制限地図の異常性をより強固に定量化することができるかもしれない。
我々は、野生型分布におけるCoV間の系統的依存性を制御していない。我々の突然変異解析では、ゲノム全体で一様な突然変異率を考慮したが、相対的な率では、SARS-CoV-2の近縁種から逆遺伝子系を作る確率が増加したり減少したりする可能性がある。

また、CoVにおける制限地図の進化をよりよく理解するために、今後の研究が必要である。SARS-CoV-2はその最初の2つのBsmBI制限部位を他のほとんどのCoVと共有しているが、RaTG13やNCBIで見つけたセンザンコウのCoVとは共有していない。一方、SARS-CoV-2の最後の3つの制限部位は、SARS-CoV-2の近縁種のほとんどと共有していないが、BANAL-20-247やBANAL-20-113などの遠いCoVに見られる(Temmam et al.2022年)。今後、より多くのCoVを対象に制限地図の全ゲノム進化を調べることで、進化的に異常な制限地図を検出するための、より強力なツールが生み出されるかもしれない。

SARS-CoV-2の起源を理解することは、次のパンデミックを防ぐための政策や研究資金調達の指針となる。

今回の研究で示唆された実験室起源である可能性は、世界的なバイオセーフティーの向上を動機づけるものである。

バイオテクノロジーの進歩と感染性クローンの低コスト生産を考えると、COVID-19以前に行われたコロナウイルス研究の透明化と、意図しない感染性クローンの実験室流出のリスクを低減するためのバイオセーフティに関する国際協調が緊急に必要である。

翻訳ここまで。

参考情報