データサイエンス専攻の大学院生が水ダウの仮説検証にマジレスしてみた
こんばんは、二階からラグランジュです。
水曜日のダウンタウン、面白いですよね。
テレビよりYouTube派なんですが、水ダウだけは毎週欠かさず見るようにしています。
そんな私が今回持ってきた説はこちら!
水曜日のダウンタウンってこんな流れですよね
①芸人さんが何かしらの「仮説」を持参する
②番組スタッフが聞き取り調査を行ったり、芸人さんが実際にそれを行ったりして、仮説を「検証」する
これって何かに似てませんか?
そうです。統計学やデータ分析における仮説検証の枠組みと同じなのです。
実際に某メガベンチャーのオウンドメディアにて、こんなことが書いてある記事を見つけました。
「ほどほどに」というところがポイントですね。もっと精緻にやる余地があるということです。
本稿では、「刑務所を出て最初に食べたいものファストフード説」を題材に、「検証の妥当性」の観点でツッコミどころを2点挙げます。
エンタメに「妥当性」なんて必要ないのですが、どうかお付き合いください。
本編の流れ
背景としては、刑務所内では1日の塩分摂取目標量9g未満を守った、味の薄い料理が出てくるということがあり、出所したら味の濃いファストフードを食べるのでは、というもの。なるほど、面白い企画です。
検証方法として、元囚人にアンケートをとり、出所して最初に食べたものを調査しています。(ん?)
検証結果は以下の通り、
1位 スイーツ 11票
2位 ファストフード 7票
3位 お寿司 4票
惜しくも説立証ならずでしたが、興味深い結果でした。
それではこの仮説検証に突っ込んでいきます。
ツッコミポイント①比較していないこと
「刑務所を出た人が」最初に食べたいものがファストフードであることを示す為に、「刑務所を出た人」にだけインタビューするのはおかしいと思っています。
私は刑務所に入っていないのですが、ファストフード食べたいです。
誰しもが、ファストフードを食べたいんじゃないでしょうか?
「刑務所を出た人が」ということを示すには、「刑務所を出た人」と「刑務所を出ていない人」のデータをそれぞれ集めて比較して、「刑務所を出た人」の方にその傾向がある、ということを示すべきなのではないでしょうか?
そうだとしても、「刑務所を出た人」に当てはまるのだったら嘘は言っていないじゃないか!という声もあるでしょう。
では、この例だとどうでしょう。
変ですよね。
刑務所に入っていようがなかろうが、誰しもが食パンなんて食べたことあります。
大事なのは、介入(刑務所に入ること)による効果(ファーストフードを食べたくなるかどうか)を、比較を通して検証することです。
刑務所を出た人だけにインタビューをして統計を取っても不十分ですよね。
ツッコミポイント②有意性が確認されていないこと
刑務所を出た直後の人とそうでない人できちんと比較して、前者の方がファーストフードを食べやすい傾向にあったとしましょう。
しかし、その傾向を「刑務所を出た人の傾向」と捉えてしまって良いのでしょうか?
これも実は不完全です。
例えば下の表のようになったとしましょう。
刑務所を出た人の50%がファーストフードと答え、刑務所を出ていない人は30%しかファーストフードと答えていないので、差があるのではないのでしょうか。
でももし、ファーストフードと答えた5人が特殊で、それ以外の元囚人は全員ファーストフード以外を答えていたらどうでしょう?
この結果は偶然そうなっただけで、「刑務所を出た人の傾向」ではないですよね。
生じた差が偶然なのか、有意(=意味のある差)なのかを検証する手段として、統計的検定があります。
今回はその中でも代表的な、カイ二乗検定(独立性の検定)を用います。
ちなみに、上のケースだと、「刑務所を出たかどうかでファーストフードと答えるか否かに差がある」という帰無仮説は有意水準5%で棄却されます(=差があるとは言えない)。
このように、2群の間に生じた差が本当に意味のあるものなのかを確かめるプロセスが重要です。
終わりに
水ダウはエンタメ目的の番組なので、こんなことをする必要は全くないと思っています。
一方で、新聞やニュース番組などで、人々の意思決定にそこそこ影響を及ぼしそうなテーマに関しても、本日取り上げたような「なんちゃって分析」が散見されます。
分析結果を鵜呑みにするのではなく、正しいプロセスを経て仮説検証が行われた結果なのか、どれぐらい信用に値する内容なのか、常に考えることが情報社会において求められるのではと、思ったり思わなかったり。
ちなみに私の好きな説は、小峠さんが死刑判決されるアレです。
この記事が気に入ったらサポートをしてみませんか?