新型コロナウイルス関係のデータを読み解くために~後ろ向きの評価について

最近頻繁に目にする新型コロナウイルスに関するデータおよび解釈には、意図した誤魔化し、理解できていないのに理解しているつもりの発言が多く見られます。データを曲解した解釈をしているのか、きちんと理解し、言葉を選んで発言しているのかを見極めること、見極める能力を持つことは、騙されないため、そして物事を正しく理解しようとする時には不可欠でしょう。

そこで今回は、データを読み解くための基本の1つである「標本調査」と標本の選び方について考えてみます。標本調査は、調査対象が大きすぎる、コストや時間の制限で全部が調べられない時に行われる調査の方法です。全数を調べられないので、調査対象の集団(母集団)の中から一部(標本)選び、それを分析して必要な情報を推定します。

ここで重要なのが、「標本」です。標本は、母集団の一部を選び出したものです。その標本に、いくつのデータが含まれるのか。標本に偏りがないか。これがポイントです。標本に偏りがなく、データの数が十分大きい場合、得られた推定結果は比較的信頼できるものになります。(「信頼できる」とは、得られる区間推定の幅が狭くなる、という意味。詳細を正確に理解するには統計を勉強してください。キーワードは、「区間指定」「信頼区間」など。)

詳細はさておき、標本に偏りがない、そしてデータ数が十分大きいならば、推定される結果は信頼できる、ということが重要です。逆に標本が偏っている場合は、データ数が大きくても信頼できません。偏った”標本”を使えば、どのような結果も得ることができてしまうからです。また偏りがある可能性に気づかず結論を出してしまうと、結論は誤ったものになってしまいます。

では「偏りがない標本」とはどんなものでしょうか。簡単に表現するなら、母集団の縮図、と考えれば良いでしょう。しかし、それがとても難しい。調査における最大の課題は、標本の選び方、と言っても過言はありません。そして検証に耐える研究では、できるだけ偏りのない標本を得ること、その選び方を必ず丁寧に述べているはずです。

例えばここで、ワクチンによる感染率の違いを調べる場合に何をすべきかを考えてみましょう。ワクチン接種した人の感染率、接種していない人の感染率を比べるのが目的です。問題は、この「ワクチン接種した人」「接種していない人」の選び方です。まず、母集団を決めます。理想的には、年代、性別、基礎疾患の有無などが母集団の縮図となるような標本を選びます。ワクチン接種有無を比べるので、このような標本(グループ)を2つ用意します。そして1つのグループ内の人にはワクチンを、他のグループの人には生理食塩水をなど効果も害もないものを接種します。接種する医師も、接種される人も、どちらを接種したかわからないようにするのが理想です(プラセボ 二重盲検)。その後、一定期間後に感染の有無を確認すれば、ワクチン接種の感染率の違いを比較することできます。これが基本であり、治験はこのように行われます。

しかし今回の新型コロナウイルス関係の情報では、統計処理的に問題となる分析(?)も頻繁に目にします。特に顕著なものは、(標本に偏りがあることを否定できない)後ろ向き調査です。後ろ向き調査は学術的には評価されません。その例を紹介して頂いているサイトがあります。新型コロナのエビデンスという岡田先生の記事の中の「後ろ向きに注意」です。

その1 後ろ向きに注意
 最近の学術論文で多いのは、「ワクチン接種を自分の意思で受けた人と受けなかった人を比べたら、受けた方の人たちで感染率が小さかった」と結論したものです。この結果は正しいでしょうか。
「自主的にワクチンを受けた人たち」と「受けなかった人たち」をあとになって比べただけなのですから。両群には何か偏りがあるはずです。たとえば接種を受けた人たちの多くが年長者で、もともと健康に関心があり、日頃から感染予防もしっかり行っていたかもしれません。
だとすればワクチン接種とは無関係に、感染率も小さくなるに決まっています。このような方法は「後ろ向き調査」、「症例対象試験」、「観察調査」などと呼ばれ、コンピュータ内のデータを計算するだけですむため、手軽で費用もかからず、昔からよく用いられてきました。医師の多くも、この方法が正当なものだと信じています。
しかし意図的な誘導が可能であり、また常に誤った結論を出してしまうことから、医学を混乱させる原因ともなってきたのです。後ろ向き調査のデータは、科学的根拠になりません。

希望者にワクチン接種をして、希望しなかった人との感染率を比べる、という方法は、上で説明したプラセボ 二重盲検と全く違います。ワクチンを接種した人たちと、希望しなかった人たちに偏りがなかったという保証が一切ないためです。

岡田先生も述べられているとおり、この後ろ向きの評価の危うさを知らずにいるならば、正しくないことを信じてしまうことになります。

岡田先生の上記の例の後に、もう1つ例が紹介されていますが、別の深刻な例を1つ示しておきたいと思います。第48回新型コロナウイルス感染症対策アドバイザリーボード(令和3年8月18日) に提示された資料です。しかしほとんどの情報が、後ろ向きの評価(つまり得られた結果の分析)であることは明らかですが、後ろ向きが問題であるということ、特に後ろ向き評価では原因究明はできないことが伝わりません。

画像1

一例を示します。ワクチン接種率と単位人口あたりの陽性者数とを比較し、負の相関がある、(因果関係さへ見出そうとしているようです)としています。統計学的には、多少の参考値にはなりますね、で終わる内容です。

情報を受け取る側、つまりほとんどの人が理解できないことを知りながら、意図的に「後ろ向きの評価」データを示して何らかの方向へ誘導をしているのでは、と疑いを持ちたくなるような事例でした。