『数字のセンスを磨く』内容(ちょっとだけ)紹介
目次とキーワード
数量化のセンス:数えることの難しさ、数量化のジレンマ
比較のセンス:数字の魔力、比較のパラドックス、数字の独り歩き、質的研究
因果のセンス:因果推論、異質性、実験、処置のジレンマ
確率のセンス:偶然の利用、スポーツと偶然、コイン投げ、自然発生的偶然
分析のセンス:データの構造、ビッグデータ、予測モデル、機械学習
数量化のセンス再訪:個体、データサイズ、反復観察
光文社さんが、「はじめに」をアップロードしてくさいました。
一番伝えたかったこと
まずこの本で私が一番伝えたかったのは、以下のことです。
私たちはしばしば「数字(データ)もないのに何がわかるもんか」という考え方を持っていて、それが行き過ぎてしまうこともあります。科学者もそうで、やろうと思えばたいていのことは数量化できる、と考えています。しかし、出来事を数字に置き換えることに含まれる相当な無理や理不尽はしばしば覆い隠されてしまうものです。
他方で、別の人たちは「数字(データ)なんかに何がわかるもんか」という考え方を持っています。もちろんこの態度も、行き過ぎれば問題です。というのは、私たちの生活はすでに数字の上に成り立っていて、数字を拒否することはすなわち生活を止めることと同じことだからです。要するに自己矛盾ですね。
この本では、この2つの方向の態度は、方向性として「両方正しく大事だ」という立場をとります。そのうえで、具体的に数字にどう接すればよいのか、を考えていきます。
この記事ではまず、数えることに際して考えるべきことを説明していきます。本書の第一章(数量化のセンス)にあたります。
数量化のジレンマ
この本では、数字を扱う上でのいくつかの「ジレンマ」や「パラドックス」を紹介しています。
まずは「数量化のジレンマ」です。
私たちは何かをデータ化(数量化)するとき、必ず最低限の特徴を「そろえる」必要があります。そうしないと、何を数えているのかわからなくなるからです。たとえば「家事の回数」を数えたいのなら、「食事の準備」「掃除」といった特徴をそろえた上で数えないと、同じ「家事1回」でも中身が違いすぎて(これを異質性といいます)、個々の数字に意味がなくなってしまうからです。
しかしこの「そろえる」という作業は実はすごく大変です。「家事」よりも「食事の準備」のほうが内容がそろっている(=同質・均質である)のは確かでしょうから、アンケート調査ではしばしば食事の準備の回数を書いてもらいます。
が、それでもまだ十分にそろっていないかもしれません。ある人は「お皿を並べて、はい1回」とカウントするかもしれませんし、別の人は「買い物して、材料から料理して、盛り付けて、テーブルに並べる」で1回だとカウントしているかもしれません。この2つは、しばしば同じ「1回」としてデータ化されるのです。
多くの人は、「そんないいかげんな」と思うかもしれませんね。「ちゃんと測定しろ」「もう少し正確なデータの観察をしろ」というわけです。
たとえばアンケート調査の設問で「以下では食事の準備の回数をお聞きします。ただし…」のように注意書きを詳しく書けば、より均質で妥当性のあるデータが手に入りそうなものですが、そうはいきません。なぜなら、詳しい情報を取得しようとすればするほど、回答拒否が増えたり、観察・測定が難しくなったりするからです。そうすると、面倒な説明書きや面倒な測定に耐えられる人のデータしか手に入らなくなります。
これが数量化のジレンマです。
これはアンケート調査(質問紙調査・調査票調査)でもあてはまりますし、人々の生活を直接に測定する際にも当てはまるでしょう。詳しく測定することは、そのような測定の条件を満たす場合のデータしか入手できない、ということを意味しています。
できるだけ均質な、しかしできるだけ広範囲のデータを集めて数量化することは、非常に難しい作業で、手練の研究者でもしばしば苦労するところです。
となれば、特にサイズの大きい(観察数が大きい)データになればなるほど、その中身は異質なものを含んでいる可能性があります。ちゃんとした研究者ならば、それを織り込み済みで、慎重に分析をしているのです。
次回は、比較の章について紹介していきます。
この記事が気に入ったらサポートをしてみませんか?