最初の感染はいつ、どこで、どのように起こったか

<第10回>

 これまでのところ、SARS-CoV-2の起源にかんしては、野生動物か研究所漏出か、2023年6月現在、結論は出ていない。多くの研究者は野生動物起源と考えているが、その決定的な証拠はない。そこで、感染のはじまり(大元)を探ろうと、さまざまな方面からの研究が試みられている。その1つが、進化生物学や生物情報科学(バイオインフォマティックス)からのアプローチだ。

 SARS-CoV-2の遺伝情報を収めたRNAには、3万弱のヌクレオチド(塩基とリン酸基を糖がブリッジしたもの)配列があり、その情報にもとづいて感染した細胞のなかでタンパク質をつくり自らを複製する。タンパク質には、スパイク(S)・ヌクレオカプシド(N)・膜(M)・エンベロープ(E)というウイルス粒子のパーツとなる「構造タンパク質」と、ウイルスの複製に使われる「非構造タンパク質(nsp)」、さらに機能がよくわかっていないアクセサリータンパク質がある。構造タンパク質はウイルス粒子を構成するタンパク質であり、非構造タンパク質はウイルス粒子を複製するために必要なタンパク質である。

 ヌクレオチドを構成する塩基には、グアニン(G)、シトシン(C)、アデニン(A)、チミン(T)、ウラシル(U)の5種類があり、DNA(デオキシリボ核酸)は塩基としてG 、C、A、T、RNA(リボ核酸)は、G 、C、A、Uをもつ。DNAではGとC、AとTが対になって二重らせん構造を形成し、DNAを鋳型につくられるRNAではTのかわりにUがAと対になる。たとえば、DNAのGCATという配列は、RNAに転写されるとCGUAになる。

 遺伝情報としてDNAをもつ生物やDNAウイルスの場合、その情報はメッセンジャーRNA(mRNA)に転写され、そこからタンパク質が合成される。その際に、ヌクレオチド(塩基)の連続した3つを1組(コドン)としてアミノ酸がコードされ(表)、そのアミノ酸の連なりによってタンパク質がつくられる。アミノ酸の種類は20種類なのに対して、塩基の組み合わせは4の3乗=64通りあるため、複数のコドンが同じアミノ酸をコードする。たとえば、UCU、UCC、UCA、UCGはすべてセリンをコードする。一方、UAA、UAG、UGAは特定のアミノ酸に対応せず、そこでタンパク質合成を終了させる「終止コドン」として機能する。またAUGはメチオニンをコードするとともに、真核生物ではタンパク質合成開始の目印=「開始コドン」となる。

表 塩基の組み合わせとアミノ酸の対応(コドン表)


 開始コドンと終始コドンにはさまれた一連のコドンの並びは「オープンリーディングフレーム(ORF)」と呼ばれる。オープンリーディングフレームからは、いったん長いタンパク質鎖(ポリタンパク質)が翻訳され、そこから酵素機能をもつメインタンパク質(Mpro)によってそれぞれのタンパク質が切り出される。

 SARS-CoV-2のRNA上には、ORF1a、ORF1b、S(スパイク)、ORF3、E(エンベロープ)、M(膜)、ORF6、ORF7a、ORF7b、ORF8、ORF9b、N(ヌクレオカプシド)の順にオープンリーディングフレームが並んでいる(SがORF2、EがORF4、MがORF5、NがORF10にあたる)。ORF1aからORF1bには、非構造タンパク質(nsp)1〜16がコードされている(図)[1]。

図 SARS-CoV-2のRNAのオープンリーディングフレームの配列
出典:Qianqian Zhang et al., 2021

 SARS-CoV-2が細胞に融合し遺伝情報を収めたRNAが細胞内に放出されると、ただちに一部の非構造タンパク質が合成される。非構造タンパク質は感染した細胞のメッセンジャーRNAを無効化して、自らのRNAの翻訳と複製を優先させる。さらにR細胞内小器官である小胞体に移動して構造タンパク質を合成。これらはゴルジ体で統合されて新たなウイルス粒子となり、細胞外へ脱出する。そして次の細胞に感染するのである。

 RNAが複製される際には、4種類のヌクレオチドの読み取りミスが一定の確率で起こる。その並びが変われば、コードされるアミノ酸が置換され、その結果、つくられるタンパク質が変異することもある。一方、前述のように複数の塩基の組み合わせが同じアミノ酸をコードしているため、アミノ酸に(したがってタンパク質に)影響を与えない場合もある。たとえばUUUがUUCになっても、アミノ酸はフェニルアラニンのままである。このような変異をサイレント突然変異(silent mutation)と呼ぶ。

 一般に、RNAウイルスはDNAウイルスより速く変異する。たとえば、ヒト免疫不全ウイルス1(HIV-1)は、真核生物の細胞の100万倍もの変異速度だといわれる。しかしコロナウイルスはRNAウイルスとしては比較的大きなゲノムサイズをもつこと、さらに感染細胞内でRNAを複製する際にミスを防ぐ一種の校正機構も備えていることから、変異速度は他の(ゲノムサイズの小さい)RNAウイルスに比べてかなり遅い。それでも、年間に24〜25の塩基が変異を起こす(いいかえれば2塩基/月)。こうした変異は中立的に起こり、その多くはウイルスの性状や感染性・増殖能力に影響を与えないが、なかには感染・増殖に不利な変異、有利な変異が生まれることがある。前者の場合は淘汰されてしまい、後者は生き残ってより優位な系統となっていく。

 COVID-19発生以来、GISAIDには世界中の研究機関・保険医療機関からSARS-CoV-2のゲノム情報がアップロードされており、その変異をたどることで、系統や別れた(変異が起こった)時期・場所などを推測することができるのである。

 第1回で書いたように、アメリカ・アリゾナ大学のマイケル・ウォロビー博士ら、アメリカ、イギリス、オーストリア、中国などの研究者らは、2019年12月〜2020年2月にかけて感染拡大が起こった武漢市において、感染者から検出されたSARS-CoV-2ゲノムの系統関係と感染拡大経過をたどり、初期の感染者の多くが華南海鮮市場やその他の生鮮市場に関連していること、1月中旬以降の肺炎による過剰死亡の報告もこれらの地域を中心に広がっていることから、華南海鮮市場など生鮮市場が感染拡大の中心エピセンターであったとしている。またSARS-CoV-2がヒト以外の哺乳類に広く感染することを考えると、2019年のヒトへの感染以前に、何らかの動物に定着していた可能性を示唆している[2]。その動物こそが、媒介動物だったということになるのだが、どこか別の場所でその動物から感染した人間が生鮮市場にウイルスをもちこんだ可能性もある。

 上のグループにも加わっているアメリカ・カリフォルニア大学サンディエゴ校のジョナサン・ピーカー博士らは、河北省武漢市ではじめて感染者が確認された2019年12月時点から、中国国外からのウイルス系統に置き換わる2020年4月までに採取されたSARS-CoV-2のゲノムを、「分子時計」を用いて分析、最初の感染は河北省で2019年10月半ばから11月半ばにかけて発生した可能性が高いと、2021年4月に発表した[3]。

 生物の遺伝情報である核酸(DNA)の塩基配列や、その塩基配列からつくられるタンパク質のアミノ酸配列は時間とともに変化する。分子時計とは、これらの分子の進化(その元になる塩基の置換=突然変異)速度が一定であると仮定して、生物間の分岐年代を推計する手法だ。これはDNAまたはRNAをもつウイルスにも当てはめることができる。ヒトに感染するようになってからさまざまな変異を繰り返しているSARS-CoV-2でいえば、それらのウイルス株の「共通祖先」がヒトに感染した最新の時期をある程度絞り込むことができる。ただし、それ以前に変異しないまま感染を繰り返していたり、ほかの変異株が絶滅してしまったりする場合には、最初の感染は最新の共通祖先以前に起こっていたことになる。

 研究者らのシミュレーションによると、最初の感染者は2019年11月4日に発生、その13日後に感染者は4人にふえ、12月1日には9人になった。研究者らは、最初の感染は華南海鮮市場ではなく、どこか別の場所──田園地帯──で起こった可能性を否定できないとも指摘している。人口密度の低い田園地帯では、動物からヒトへの感染が起こっても、それほど広がらずに消えてしまう確率が高い。しかし、いったん人口が密集する大都会へウイルスがもちこまれると、爆発的に広がってしまうおそれがある。

 やはりウイルスを運んだのは、野生動物ではなく野生動物を扱う業者だったのかもしれない。

 マイケル・ウォロビー博士は、2019年12月から翌年1月はじめにかけて、武漢市内の病院に入院した未知の病因による肺炎患者のうち、3分の1〜3分の2しか華南生鮮卸売市場と関係をもっていなかったのは、軽症者や無症候感染者が多く、すでに感染源を追えなくなっていたためだとみている[4]。

 当時の地元新聞によれば、確認されたなかで最初のCOVID-19患者は、武漢市内に住むが華南生鮮卸売市場への訪問歴がない男性会計士で、12月8日に発症していたとされる。これが、SARS-CoV-2の同市場起源説に疑問を投げかけると同時に研究所漏出説を後押しするものとなってもいたのだが、この男性が実際に発熱したのは12月16日で、12月8日は歯科医にかかった日だったことがあとでわかった。市場関係者の最も早い入院は10日で、16日には同市場関係者に感染疑いケースが複数出ていた。この時点で感染はすでに市場関係者のクラスターから市中へと広がっていたとみられる。最初の患者と疑われた男性会計士は、市中感染した可能性が高いのだ。

 一方、COVID-19が中国・武漢市で広がりはじめた2019年暮れから2020年はじめにかけて、武漢市や湖北省では、SARS-CoV-2に2つの系統が存在していたことがわかっている。1つは武漢市で2019年12月30日と2020年1月5日に採取された株(Wuhan/WH04/2019)の系統で、B系統群(クレードB、のちに19B)と呼ばれた。一方、2019年12月24日と26日に別々に採取された株(Wuhan-Hu-1)は、これとは異なる変異をもっており、A系統群(クレードA、のちに19A)として区別された。ややこしいが、SARS-CoV-2の変異株を表す標準的な分類体系となったPANGO系統[Cov-Lineages*]では、19BがA系統、19AがB系統となっている。ほかにGISAID(「全インフルエンザ・データ共有のための国際イニシアティブ」:第1回参照)も独自の分類体系(19BがクレードS、19AがクレードL)を採用している。

 当初より、PANGOのA系統(=19B)がより古い先祖型で、そこから変異してB系統(19A)が生じたと考えられてきた。A系統は初期に武漢で広がり、日本や東南アジア、アメリカ西海岸にも伝わった。一方、B系統は湖北省全域で感染流行を引き起こし、人の動きに伴って中国各地や海外へ広がった。その後B系統からスパイクタンパク質に「D614G変異」をもつB.1系統が出現、世界的なパンデミックをもたらした。現在の主要変異株はすべてB.1から派生した亜系統で、A系統からは懸念変異株(VOC)や注目変異株(VOI)は生じていない。というより、B.1系統が世界中に広がるなかでA系統は滅びてしまったようなのだ。

 先のピーカー博士やウォロビー博士らは、感染流行が起こった武漢市において、動物からヒトへの新型CoV感染が2度起こった可能性を指摘している[5]。

 A系統とB系統はRNAの8782番めと28144番めの塩基が異なっている。研究グループが2020年2月28日までに採集され同12月31日までにGISAIDに登録されたSARS-CoV-2のゲノム配列のうち、日付が不確かなものなどを除く1716を詳しく比較分析したところ、2つの系統の中間的な(過渡的な)ゲノムをもつウイルスは、この時期には流行していなかったらしいとわかった。それまでに確認され中間型とされていたゲノムは、試料のコンタミネーション(混入、汚染)やソフトウエア上の不正確な読み取りなどによるエラーの可能性が高いという。

 中間型が存在しないというこの分析が正しければ、A系統から変異によってB系統が生じたのではなく、この2つの系統はもともと起源が異なっていた、つまり動物からヒトへの感染は(少なくとも)2度起こったということになる。実際にB系統の検体には華南海鮮市場における感染者から採取されたものが含まれており、A系統の検体には武漢市内の他の市場関係者からのものが含まれているという。

 これらの情報を考え合わせると、SARS-CoV-2は武漢市の生鮮卸売市場(複数)で広がる以前に、何らかの動物──ある程度の生息密度があることを考えると野生ではなく飼育下の動物──に広がっており、そのなかですでに複数の系統に分化していた。それらのウイルスが、動物かあるいは動物を扱う業者によって、別々に、ただしほぼ同じ時期に、武漢市複数の生鮮市場に運ばれ、そこでアウトブレイクを引き起こした、というシナリオが考えられる。もちろん、仮説にすぎないが。なお、SARS流行の際も、動物−ヒト感染は複数回あったと考えられている。

 次回はB.1系統について詳しくみていきたい。<つづく

*PANGO系統─イギリス・エジンバラ大学教授で進化生物学者のアンドリュー・ランボート博士が主宰。ランボート博士の研究グループはPANGO系統体系を提唱[6]し、ソフトウェアも開発している。


[1] Qianqian Zhang et al., Molecular mechanism of interaction between SARS-CoV-2 and host cells and interventional therapy, Signal Transduction and Targeted Therapy, 6(1), 2021

[2] Michael Worobey et al.:The Huanan Seafood Wholesale Market in Wuhan was the early epicenter of the COVID-19 pandemic, Science, 377(6609), 2022

[3] Jonathan Pekar et al.:Timing the SARS-CoV-2 index case in Hubei province, Science, 372(6540), April 23, 2021

[4] Michael Worobey:Dissecting the early COVID-19 cases in Wuhan, Science, 374(6572), 2021

[5] Jonathan E. Pekar et al.:The molecular epidemiology of multiple zoonotic origins of SARS-CoV-2, Science, 377(6609), 2022

[6] Andrew Rambaut et al.:A Dynamic Nomenclature Proposal for SARS-CoV-2 Lineages to Assist Genomic Epidemiology, Nature Microbiology, published 15 July 2020

この記事が気に入ったらサポートをしてみませんか?