見出し画像

新型コロナウイルスのゲノム配列から、2016年に特許を取得した配列が見つかった。 偶然に発生する確率は3兆分の1

MSH3 Homology and Potential Recombination Link to SARS-CoV-2 Furin Cleavage Site
SARS-CoV-2のフリン切断部位とMSH3の相同性および組換え可能性

Balamurali K. Ambati1, Akhil Varshney2, Kenneth Lundstrom3*, Giorgio Palú4, Bruce D. Uhal5, Vladimir N. Uversky6 and Adam M. Brufsky7

Balamurali K. Ambati 博士の紹介文
「リアル・ライフ・ドギー・ハウザー」として知られるバラムラリ・アンバティ博士は、米国の眼科医で、教育者、研究者、オレゴン大学ナイトキャンパスの眼科・視覚科学部長として、科学的インパクトを加速しています。白内障、角膜、屈折矯正の外科医として15年の経験を持つ。世界最年少の医師にも選ばれたアンバティ博士は、いくつかの眼科機器を開発し、Ophthalmologist Magazineによる40歳以下の世界的コンテストで第1位の眼科医に選ばれています。彼は天才児で、いくつかの賞を受賞しており、その中にはユタ大学の医学生によるゴールド・ヒューマニズム・アワードも含まれています。また、ORBIS、Sightlife、Sight for the Sightless、Help Mercy Internationalなどの人道支援団体と協力しています。アンバティ博士は、人々の生活に変化をもたらすという動機を持ったインスピレーション溢れる人物であり、医療分野における彼の仕事に対して計り知れない尊敬と称賛を集めています。
【 解説 】
新型コロナウイルスのゲノム配列の一部を、BLAST検索にかけたら、2016年2月4日に出願された米国特許9,587,003 に見られる独自配列(SEQ ID11652, nt 2751-2733)と100%逆マッチした。
この特許は、ワクチン製造を行っているM社が取得したものです。
そして、自然界で偶然にこの配列が現れる確率を計算したら、3兆分の1となりました。論文の筆者は、自然発生と「他の可能性」があると書いています。明示していませんが「他の可能性」とは人工的に作られた可能性のことです。

SARS-CoV-2とコウモリRaTG13コロナウイルスとの間には多くの点変異の違いがあるが、12ヌクレオチドのフリン切断部位(FCS)のみが3ヌクレオチドを超えている。BLAST検索の結果、SARS.Cov2ゲノムのフリン切断部位を含む19ヌクレオチド部分は、ヒトmutSホモログ(MSH3)の逆相補体であるコドン最適化独自配列に100%相補的に一致することが判明した。SARS-CoV-2に存在する逆相補配列はランダムに発生する可能性があるが、他の可能性も考慮しなければならない。中間宿主での組換えは考えにくい説明である。SARS-CoV-2のような一本鎖RNAウイルスは、感染細胞内で負鎖RNAを鋳型としており、負センスSARS-CoV-2 RNAとのコピー選択組み換えにより、FCSを含むMSH3負鎖がウイルスゲノムに組み込まれる可能性がある。いずれにせよ、MSH3 mRNAの逆相補体と100%一致するFCSを含む19塩基の長鎖RNA配列の存在は非常に珍しく、さらなる調査が必要である。

はじめに

SARS-CoV-2の挿入変異体に関する最近の論文(1)に基づき、SARS-CoV-2スパイク(S)タンパク質のフリン切断部位(FCS)の配列に関する我々の最近の知見に注意を喚起したいと思う。COVID-19パンデミック(2)を起こしたSARS-CoV-2は、コウモリコロナウイルスSL-CoVZC45と82.3%、SARS-CoVと77.2%、コウモリコロナウイルスRaTG13と96.2%のゲノム配列同一性を有している。SARS-CoV-2とRaTG13の間には多くの点突然変異の相違が存在するが、3ヌクレオチド(nt)を超える挿入・非類似は1つだけである:SARS-CoV-2のSタンパク質に4アミノ酸(aa 681-684, PRRA)をコードする12ヌクレオチドの挿入が発見された。この多塩基性FCSは、SARS-CoV-2と他のb系統のベータコロナウイルスや他のどのサルベコウイルスとも区別される(3)。FCSの添加により、2019年のSARS Co-V-2の感染性が向上した(4)。このFCSがない場合、動物ワクチン接種に有用なSARS-CoV-2変種が減弱するため、ヒトへの感染との関連性が強調される(5)。このFCSは、ヒトとフェレットの感染に不可欠であり(6)、ヒト細胞へのウイルストロピズムを拡大し(7)、SARS-CoV-2の2つの動物モデルにおいて重症化に必要なものである(8)。

SARS-CoV-2スパイク蛋白とMSH3

SARS-CoV-2 Sタンパク質のPRRA furin切断部位をコードする塩基配列の特徴は、CGGコドンが2つ連続していることである。このアルギニンコドンはコロナウイルスでは珍しく、センザンコウのCoVのCGGの相対同義性コドン使用率(RSCU)は0、コウモリCoVでは0.08、SARS-CoVでは0.19、MERS-CoVでは0.25、そしてSARS-CoV-2では0.299である(9)。

12塩基の挿入をBLAST検索したところ、2016年2月4日に出願された米国特許9,587,003(10)に見られる独自配列(SEQ ID11652, nt 2751-2733)と100%逆マッチしました(図1)。SEQ ID11652を調べると、一致は12ヌクレオチドの挿入を越えて19ヌクレオチドの配列に及んでいることが明らかになりました。5′-CTACGTGCCCGCCGAGGAG-3′(SEQ ID11652のnt 2733-2751)、その結果mRNAが3′-GAUGCACGGCGCUCCUC-5′を有することになるようにである。または同等に5′- CU CCU CGG CGG GCA CGU AG-3′(SARS-CoV-2ゲノムのヌクレオチド23547-23565、この中の4つの太字コドンによってPRRA、そのスパイクタンパク質のアミノ酸681-684が得られる)である。これはNCBI BLASTデータベースでは非常に稀である。

画像1

図1. SARS-CoV-2におけるフリン配列の起源。SARS-CoV、RaTG13、SARS-CoV-2のS1/S2接合部のタンパク質配列を比較すると、SARS-CoV-2にのみフリン切断部位(FCS)PRRAが存在することがわかる。FCS PRRAをコードする12ヌクレオチドストレッチのBLAST検索に基づき、19ヌクレオチド長の同一配列が特許(US 958 7003)配列Seq ID11652に同定された。SEQ ID11652は、ヒトに対してコドン最適化されていると思われるMSH3 mRNAに転写される。ヒトMSH3遺伝子に存在するFCS PRRAをコードする12ヌクレオチドを含むこの19ヌクレオチド配列は、MSH3遺伝子を過剰発現しているSARS-CoV-2感染ヒト細胞において図示のコピー選択組み換え機構によりSARS-CoV-2ゲノムに導入されたのかもしれない。

このSARS-CoV-2配列と独自に開発したmRNA配列の逆相補体との相関は、その由来が不明である。従来の生物統計学的解析では、この配列が3万塩基のウイルスゲノムの中にランダムに存在する確率は3.21×10-11とされている(図2)。

画像2

図2. 研究対象である19nt配列の自然発生確率の計算結果。SARS-CoV-2ゲノムは約30,000塩基の長さ(P1)。特許配列の長さは約3,300塩基(P2)。特許ライブラリは、中央値が3,300ヌクレオチドの範囲である、様々な長さの24'712配列を包含する。ヒトゲノムと特許ライブラリの配列のいずれかに19塩基の配列が存在する確率を従来の確率計算で算出した。

独自に開発した配列SEQ ID11652を順方向に読むと、ヒトmut S homolog 3(MSH3)(9)とアミノ酸が100%一致するようにコードしています。MSH3は、DNAミスマッチ修復タンパク質(MutSβ複合体の一部)である(11)。SEQ ID11652は、ヒト用にコドン最適化されていると思われるMSH3 mRNAに転写される(12)。19塩基の配列CTCCTCGGCGGCACGTAGは、BLASTデータベースで100%のカバー率と同一性を持つSARS-CoV-2以外の真核生物やウイルスゲノムでは見つからなかった(補足表1-3)。

考察

ヒトでの発現にコドン最適化されたmRNA配列によるMSH3の置換は、ミスマッチ修復不全のある癌に応用できそうである。SARS-CoV-2に存在する逆補数配列の一部は偶然の一致かもしれないが、他の可能性も考慮する価値がある。

MSH3の過剰発現はミスマッチ修復を妨害することが知られており(MSH2とMSH6からなるMutSα複合体からのMSH2の隔離はMSH6の分解とMutSαの枯渇をもたらす)(13)、これはウイルス学的に重要なことである。DNAミスマッチ修復欠損の誘導は、A型インフルエンザウイルス(IAV)のヒト呼吸器細胞への感染を許容し、病原性を増大させる(14)。ミスマッチ修復欠損はSARS-CoV-2の排出を拡大させる可能性がある(15, 16)。

BLASTデータベースでCTCCTCGGCGCACGTAGが真核生物やウイルスのゲノムに存在しないことから、中間宿主での組み換えはSARS-CoV-2における存在の説明として考えにくい。ヒトMSH3と100%相同なタンパク質をコードするヒトコドン最適化mRNAは、ウイルス研究の過程で、不注意にあるいは意図的にヒト細胞株のミスマッチ修復欠損を誘発し、SARS様ウイルス感染に対する感受性を高める可能性がある。SEQ ID11652-MSH3が導入されたヒト細胞にSARS様ウイルスが感染すると、コピーチョイス組換えが可能になる可能性がある(15)。SARS-CoV-2をはじめとする正極性のRNAゲノムを持つ一本鎖RNAウイルスの複製は、感染細胞の細胞質で負鎖RNAが合成されることにより開始される(17)(図1)。負鎖RNAは、非構造タンパク質、複製・転写複合体、新しいビリオン・キャプシドの翻訳に利用される正鎖RNAの合成の鋳型となる。コロナウイルスは、感染初期にゲノム複製とmRNAの転写により二本鎖RNAを生成する(18)。

過剰発現したポジティブセンスMSH3 mRNAから逆補体FCS配列を獲得することは、ネガティブセンスSARS-CoV-2 RNA中間体とのコピーチョイス組み換えによって起こる可能性があり(15)、あるテンプレートから別のテンプレートへのジャンプを伴う(19)(図1). SARS-CoV-2と他の既知のコロナウイルスとの相同性は途絶え、ほとんどのSARS-CoV-2配列はコウモリRaTG13と比較的最近の共通祖先に由来している。さらに、類似性プロット(SimPlots)により、SARS-CoV-2とRaTG13の間の配列同一性の急激な変化が確認され、潜在的な組み換え事象を示唆している。これは、RaTG13のRBDには当てはまらない、そのRBDを介してACE2に結合するSARS-CoV-2の能力を説明できるかもしれない(15)。

この仮説に対する批判は、同定された配列がSEQ ID11652のオープンリーディングフレームの反対鎖にあることである。しかし、ミスマッチ修復欠損を誘導するMSH3でトランスフェクトした細胞は、SEQ ID11652をコードする二本鎖cDNAを標的にしている可能性がある。RdRpを発現するSARS様ウイルスと共導入した細胞は、この19塩基配列に結合し(15)、オープンリーディングフレームの反対鎖にあるにもかかわらず、FCSを含むウイルスゲノムに負鎖からの断片の統合を可能にすることができる。ミスマッチ修復機構は、実験モデルにおいてアンチセンス鎖からの短い断片の統合を可能にした(20, 21)。マイクロホモロジーはMSH3とSARS様ウイルスとの間の組換えを誘導することができ、それは関心のある19塩基配列で起こる可能性がある。

SARS-CoV-2において、そのスパイクタンパク質のアミノ酸681にFCSをコードする19ヌクレオチドRNA配列が、独自のMSH3 mRNA配列の逆相補体と100%同一であることは、非常に珍しいことである。この相関関係を説明できる可能性があるため、さらに調査する必要がある。

以上

参考記事