見出し画像

研究データの読み方

読んでいただきありがとうございます。  

これからもよろしくお願いします。    


本日TVでみた数値の話。

「コロナウィルスの無症状患者からの感染は

ある研究データでは40%」と発表していました。

事実はわかりません。

伝えたいのはこの40%というのがどのくらい危険かということです。


深沢真太郎先生の

『数学女子智香が教える仕事で数字を使うって、こういうことです』

では、この数値の読み取りをわかりやすく解説しています。

本日はこの本についてお伝えします。


この本との出会い

確か去年だったと思います。

社会人であれば数字を使った説明が必要ってのを

よく聞いていて。

そんな時にネットで見つけたような気がします。


感想は

とても面白いです。

日本だけでなく、世界中で共通の言語。

国籍だけでなく年齢や性別も問いません。

個数にしても割合にしても

多く感じるか少なく感じるかは別として

「1個」は誰にとっても「1個」だし

「50%」は誰にとっても「50%」と伝わります。

それが数字です。

数学っていうのはなんだか計算することって思っていましたが

実は数字を使って人にメッセージを伝えることなんだなって感じました。


気になる内容は

実際に読んでみてください。

とても面白かったことをひとつご紹介します。

統計データを出す時には母数が重要です。

確か、全国的な統計データとして必要な母数は最低1000件。

1000件のデータがあればその割合を人口に合わせて

計算できるはずです。(間違いだったらすいません。)

例えば、特定集団1000人の中で10人が年収1億円を超えていた。

そういうデータがあれば

全国で1300000人が年収1億円を超えていることになって

人口5000人の田舎でも年収1億を超える人が5人いるってことになります。

人口が1000人以上いれば少なくとも1人は年収1億円を超えているはず。

でもそんなことないですよね。

割合はあくまでも割合。絶対にいると保証するわけでありません。

重要なのは、1000人に1人の条件を解析することです。


冒頭でお伝えした

「コロナウィルスの無症状患者からの感染は

ある研究データでは40%」というのは危険なのか?

極端な考え方をすれば

全世界で感染者数は1000万人、

その40%と考えると400万人。

しかし、統計データの母数を1000人でとって

そのうちの400人いた。

でも他の999万9600人は

全くそのデータが当てはまらないとどうでしょう?

400万人対400って40%の割合もどちらを信じるかで

危険か危険じゃないかかなり変わってきますよね。

僕は実際に統計の専門家ではありません。

統計データに必要な母数も違うかもありません。

ただそれでも、割合では何も評価できないということ。

割合の解析が重要。

割合と同時に、全体の数字もみないことには

何も判断できません。

2つ以上のデータで判断しましょう。




https://twitter.com/taro_nutrition  

https://www.instagram.com/taro_book.read/?hl=ja  

https://note.com/taro_humuhumu   

https://taro0000.wordpress.com/  

で、SNSやっています。 

「いいね」「フォロー」「コメント」よろしくお願いします。 


#yuki ota さん  

画像使わせていただきました。ありがとうございます。


この記事が気に入ったらサポートをしてみませんか?