荒川氏の最初のメールからSkype会議まで(12/27~1/16)

今回から、2021年12月から22年3月の全てのメールの文面(個人情報に関する部分や会議の日程調整の連絡などはのぞく)を公開して、荒川氏の下記noteに書かれた内容の虚偽および印象操作を明らかにする。

最初に明確にしておくが、『事実上、彼の論文の「全データ」を出したのは私』、つまり私と松本氏(東工大教授)の共著論文は荒川氏のデータを盗用して書かれたものだという荒川氏の主張は完全な虚偽である。私と松本氏の共著論文に荒川氏から提供されたデータは1つも含まれていない。この点は、メール全文公開で立証できる内容である。

オミクロン株の件で、荒川氏から最初にメールが届いたのは12/27である。オミクロン株の変異のN変異とS変異の偏りから、人工起源を疑うnoteを紹介する内容であった。

これに対する私の返信メールは以下のとおりである。

(計算をしてしてみました→計算をしてみました)
(治験→知見, 赤線は著者加筆)

これに対する荒川氏の返信は以下のとおりである。1通目では下記note

を引用して、論文共著の呼びかけをしている。注目すべきは2通目である。ここに、荒川氏が「200人程の参加者」と書いたパリグループについて「参加者は毎回30人前後」と明記している。この点についてはパリグループの他のメンバーに確認をとることも可能である。この誤りは、荒川氏が十分な確認をせずに、あやふやな記憶をもとにnoteを書いていることを裏付けるものである。

また、2通目のメールの最後に荒川氏を共著に誘った理由も書かれている。今でこそ新型コロナウイルス研究所起源を表で論じる科学者は増えたが、2020年から2021年末まで、日本でそれを追究している科学者は私一人であった。それゆえ、医師をはじめとする多くの人々から「掛谷は陰謀論者である」との攻撃を受けた。「専門でもない人間の言うことは信用できない」という批判も多かった。生命科学者でない私が単著で論文を書いても、学術誌の査読を通ることは期待できなかった。

技術的には単著で論文を書くことは可能であった。だが論文を学術誌の査読に通すというのは極めて政治的要素を含む。多くの学術誌はダブルブラインド(著者は査読者を知らず、査読者も著者を知らない)ではなく、シングルブラインド(著者は査読者を知らないが、査読者は著者を知っている)で査読が行われる。よって、全く同じ内容の論文でも、著者が誰かによって査読を通ったり通らなかったりする。STAP細胞事件の小保方晴子氏の論文が、何度出しても査読を通らなかったのに、笹井芳樹氏が共著者になったら査読を通ったことは有名である。

オミクロン株起源の論文も、生命科学者が共著であることは論文の学術誌掲載を目指す上で必要不可欠だった。結果的に、荒川氏は共著から外れたが、松本氏が共著に残り、論文は無事学術誌掲載に至っている。(なお、その後同じ学術誌に私と学生だけが共著の別論文を投稿したが、それはリジェクトされた。分子生物学会で査読者のコメントを現役の生命科学者に見せたが、不当な評価であるとの見解であった。)

私のメールに対する荒川氏の返信は以下の通りであった。

(赤線は著者加筆)

このメールで注目すべき1点目は「サイドバイサイドなどで同時に投稿するのでもいいです」と荒川氏が書いている点である。荒川氏は先日のnoteで『それどころか掛谷先生は「自分でも別にもう一報論文を書きたい」と主張され始め、私は不愉快でしたが承諾しました』と書いているが、別々の論文を書くという選択肢は、もともとは荒川氏が提示していたものである。サイドバイサイドで書くことになった経緯は次回以降で説明する。

次に、コンセンサス配列の作り方についてである。荒川氏はnoteで『私が自分自身の論文で用いたのは多数のウイルス配列の比較から推定したそれぞれの変異株の祖先型です。実際、解析すべき配列さえ分かっていれば類似の配列をデータベースから検索する事自体は容易です。そしてその後、掛谷先生は私が渡したものと類似の変異パターンを持つ配列を検索で探し出し、同様のデータを再現しました』と書いている。しかし、そもそも上記メールに書かれた荒川氏のコンセンサス配列の作り方は、信頼性の高い方法ではない。

私自身、コンセンサス配列を自分で作って書いた論文が2本ある。

これらの論文では、ある変異株あるいは系統として登録された全ての配列データの中で最も頻度が高い塩基(アミノ酸)配列をコンセンサス配列として、それを基準に復帰変異をカウントしている。荒川氏の論文は初期に登録された配列データ10個だけでコンセンサス配列を作っているので、そこにたまたま特殊な配列が固まって登録されていると、典型的な配列ではなくなる。全登録データを使う方が遥かに信頼性は高い。

なお、武漢株やオミクロン株BA.1のように、非常に有名な変異株は、コンセンサス配列と一致する代表的な登録データのデータ番号(アクセッション番号)が知られている。掛谷・松本論文は、草稿段階で用いていた荒川氏作成の(信頼性の低い)コンセンサス配列を使う代わりに、広く知られている標準的な(信頼性の高い)配列を使用したに過ぎない。よって荒川氏の主張する「私が渡したものと類似の変異パターンを持つ配列を検索で探し出し」は明らかな間違いである。当初、信頼性が若干劣るデータを使うことにした理由は、荒川氏との共著論文にするため、荒川氏のデータを使用する必要があると考えたからである。

なお、主要な変異株のコンセンサス配列が、武漢株から見てどこに変異があるかは

にリスト化されており、掛谷・松本論文のTable A.3にも、ここから抜き出した変異のリストが掲載されている。

3点目に「全ての変異株が人工ウイルス」とする荒川氏の主張について述べたい。荒川氏のnoteで2022年秋の共著論文

について『論文の論理展開自体にも納得がいかず何度も強く批判しました』と述べている点は、まさにこの主張に関する見解の不一致である。全ての変異株が非同義変異に偏っているというのは事実であっても、それゆえに全ての変異株が人工ウイルスという推論は論理的に成り立たないというのが私の主張であった。

これについて例を使って説明しよう。たとえば、普段平均的な成績をとる10人のクラスで、全体の平均点が75点、標準偏差10点のテストで全員が90点以上をとったとする。このとき、10人のうち何人かがカンニングをした確率は1に極めて近いが、全員がカンニングした確率は高くない。正規分布に従うと考えれば、個々人が90点以上をとる確率は7%程度はある。1人ぐらいは自力で90点をとっていても全くおかしくない。これは論理学の基本だが「全てが人工でない」の否定は「全てが人工である」ではなく「一部に人工のものがある」となる。

最後に、荒川氏がメールで「科学者のための論文ではなく、世界市民に告発するための論文のつもり」と書いている点に触れたい。荒川氏はnoteで『「真理の探究などは誰か別の人にでもやってもらえば良い。自分の論文発表はある意味政治的行為として正義のために行なっている」といった事もおっしゃっていました。これも科学者として私には同意できない考え方でした。』と書いている。私はこの種の発言は一切していない(詳細は次回以降に触れる)が、荒川氏自身は自らの論文に政治的意味をもたせようとしていたことがメール文面に残っている。にもかかわらずnoteでは「同意できない考え方」と批判している点は、荒川氏の自己矛盾を示している。

今回のまとめ

  • オミクロン株の起源について最初にコンタクトをとったのは荒川氏からである。

  • 論文共著を最初に持ちかけたのは掛谷である。理由は、生命科学者との共著でないと論文を学術誌に採択させることはほとんど不可能で、当時他に新型コロナウイルス人工起源を主張する生命科学者が日本にはいなかったからである。

  • 論文を2本サイドバイサイドで投稿する選択肢を最初に示したのは荒川氏である。

  • 荒川氏によるコンセンサス配列の求め方の信頼性は高くない。掛谷・松本論文を含め、掛谷が第一著者の論文はより信頼性の高いコンセンサス配列を用いている。荒川氏のコンセンサス配列と似た配列を検索して使ったというのは事実に反する。

  • 荒川氏は新型コロナウイルスの全ての変異株が人工と考える一方、掛谷はその一部に人工のものが含まれるとしか論理的に主張できないと考えていた点で、見解の相違があった。

  • 荒川氏は自らが書こうとしていた論文を「世界市民に告発するための論文」と位置付けていた。

このメールの後、Skype会議の段取り決めのメールのやりとりが続く。そこは本質から外れるので省略して、次回はSkype会議後の一連のやりとりを紹介することにする。