見出し画像

厚労省によるデータはどう発表されてきたか

馬の眼氏(https://note.com/ishtarist)の記事ですが、半年以上たった今でもデータ面に関して的を射る指摘ばかりであり、言い換えれば厚労省はこのデータ処理の問題を放置、あるいはさほど重要視していないという証左ともいえるでしょう。

厚労省・新型コロナ陽性者データに内在する不可解な矛盾

-----(以下、引用)

データ分析の世界ではgarbage in, garbage out「ゴミを入力すれば、ゴミしか出力しない」と、よく言われます。有意義な分析をするためには、最低限、データがまともである必要があります。まともなデータとは、最低限、正しいデータ入力と、論理的整合性が必要です。だからデータアナリストは、分析の前に必ずデータの整合性を検討し、矛盾のないカテゴリ体系を設計し、データの整備に過半の力を注ぐのです。

続報1 厚労省データ処理の根本的な誤謬と、流氷原を漂流する巨大客船

-----(以下、引用)

正しいデータ運用としては、「データの誤りが見つかったら、過去に遡って修正」しなければならない。つまり、データの「バージョン管理」と「日次データ更新」は、完全に分けて考えないといけないのです。

続報2 厚労省さんの「お返事」と、私からのお願い

続報3 厚労省データと、安倍政権の反民主主義的体質

-----(以下、引用)

これまで「PCR検査を拡大すると医療崩壊する」と言っていた「専門家」たちが、「フェーズが変わった」という言い訳をして、今はまったく逆のことを言っている。自分たちが、どれほど政府の無策を助長し、感染を蔓延させることに荷担したのか、それに対する反省が一切ありません。こういう「専門家」たちの無責任体質と、厚労省がやってることは非常によく似ています。

続報4 新型コロナ感染者の一元管理システムは役に立つのか

-----(以下、引用)

現場の声を拾って制度設計につなげた今回の出来事は、とても良かったと思います。ただし、これは本来なら、感染拡大最初期に、政権内あるいは官僚から、持ち上がっていないといけない話のはずです。すべての自治体が、統一されたフォーマットでデータを都度アップロードして、それを政府が全データをリアルタイム集計し、また集計データと元データを全国民に公開すべきだったのです。


 馬の眼氏の個々の記事内容における政権や官僚に対する見解についてまでも同意というわけではありませんが、データの取り扱い、データ処理の姿勢には数多くをの知見をいただきました。「涙なしの○○」であっても、涙しながら苦闘してさえもあまり身についた感触のない統計素人ですが、ここで改めて厚労省のデータについて振り返っておこうと思いました。

 私が厚労省のデータ記録を始めたのが令和2年4月からでした。この時は、日本国籍の者、外国籍の者、国籍確認中の3つに分類されていました(国内事例のPCR陽性者数が表示されていて、注書きで日本国籍、外国籍がそれぞれ人数表記され、それらを除いた数値が国籍確認中、という理解です)。

画像1

これが5月8日まで続き、累計で日本籍以外(外国籍と国籍確認中)の割合は50%を超える状態が続いていました。

画像2

ただ、今にいたっても「国籍確認中」というものをどう理解して良いのかがわからずじまいです。日本国籍の者なら医療機関に行く際に必ず健康保険証を提示を求められるであろうし、外国籍であっても医療機関にかかる際には健康保険証を提示しているはずです。保健所での検査ということであっても氏名は確認しているはずであり、正確ではないにしろ日本国籍かそれ以外はある程度類推できるでしょう。ましてお役所的機関において名無しの人を名無しのままで扱うほど、杜撰な情報管理はしてないはずです。新型コロナウイルス感染者等情報把握・管理支援システム(仮称)の導入について(https://www.mhlw.go.jp/content/000626714.pdf)にある別紙の資料をみても氏名は確実に把握していると想定できます(国籍を入力必須項目に入れていれば…と個人的には感じています)。

画像3

画像4

 このシステムを導入した結果なのかはまではわかりませんが、5月9日から国籍に関する数値の公表がなくなり、データソースも厚労省把握のものから各自治体のweb数値の積み上げへと変えてしまいました。

画像5

これによって、国籍による数値の分析はできなくなりました。さらにデータの収集方法が変わってしまったため、時系列的に数値の比較分析を行い正確な原因を探るということが不可能になってしまったのではないかと考えています。まさに「ゴミを入力すれば、ゴミしか出力しない」です。データ収集時点で(不正確な情報のまま集計、または統一的にある程度決められた基準を満たしていることをもって集計されることが保証されていない)ゴミに対して、いくら高度な解析をしたとしても導き出される結果は『ゴミ』なのです。当然この『ゴミ』を前提としておこなわれる各種の議論も、意味のあるものとはいえないでしょう。

 もちろん、政府や(学歴エリート集団と目される)厚労省職員はこのあたりを熟知していて、正確な情報を把握し政府が適切な決定を可能にするような情報を提供している、と信じたいです。しかし、この期に及んで「Go To」を原因とするようなマスコミや世論を野放しにしているのを見るにつけ、そういった信頼は大きく揺らいでいます。感染の広がりがみられる現在においてこそ、その原因が「Go To」なのか、「入国によって持ち込まれ、広まったこと」が原因なのか、インフルエンザや通常の風邪が流行る時期と重なった「季節性要因」が原因なのか、などなど正確な原因分析を行い適切な是正策を講じる上でも『国籍情報』は有用なものであるという考えています。

未知を理解するためには、既知の領域を正確に把握・整理した上で、既知の領域から未知への対策を講じる以外の方法はないのではないでしょうか。

この記事が気に入ったらサポートをしてみませんか?