見出し画像

統計学依存からの離脱

さまざまな学問分野で、統計学の採択が重要視されるようになってきていて、わたしも統計学の講義をすることが随分と増えた。ということは、年々上司や取引先にも統計学できるひとが増えていってるってことでますます重要視されるようになっていくと思う。

けれども、やっぱり統計学は難解なところがあって、学生さんたちにマスターしてもらうことがすごくむつかしい。じゃあ統計学使えなかったら学問できないのか、っていうと、そんなことはないと思う。

そこでここでは、統計学が何を目指すものかを要約した上で、「統計学的な方法」を提案したい。

◆統計学の技法
統計学の技法はおおまかに二つだ。

①記述
一つ一つのデータがどんな姿をしているかを要約する。平均値を出したり、割合を出したり、月ごとの変化をグラフにしたりする。

②因果推定
二つ以上のデータ同士の関連性を分析する。関連性の指標は、強さ・相関値・検定値の三つで示される。

まず強さについて。アイスクリームの売り上げ(結果)は、気温(原因)にどの程度左右されるか、といった分析をする際に、気温が1℃上がったらアイスクリームの売り上げは何個変わるか、という値のことだ。

相関値とは、強さがどれくらいの誤差の幅を持っているかという値のことだ。気温1℃上昇に対して、アイスクリームの売り上げが間違いなくきっかり2個増えるのであれば相関値は高く、2±1個増えるのであれば相関値は低くなる。

検定値とは、調査結果が偶然とは考えにくいかどうかを示す値のことだ。対象全体の一部を調査して全体の傾向を推測するときに用いられる。アンケートが10枚しか集まらなかったらどんな分析結果も偶然の可能性が高いということになる。

◆統計学的技法(統計技法ではない)の提案
つまり言い換えると、ひとが統計学を使って自分を納得させたり他人を説得したりする文章を書くときに示さなければならないものは次の4つだといえそうだ。

①データはどんな姿をしているか
②因果関係の推定にあたっては、
 ・充分強い因果関係がありそうか
 ・誤差が低く、原因-結果間の予測精度が高いか
 ・調査結果は偶然とは考えにくいか

これらのことが説得力をもって示すことができるのならば、文章で語ったっていいし図示するのだっていいんじゃあないかと思う。たとえばこんな文章はいかが?

◇◇◇

大学内の売店4カ所で1年分の売り上げデータを取得した。

休業日を除く300日×4でデータの総数は1200であるため以下の調査結果は偶然とは考えにくい。

調査の結果、一日あたりのアイスクリームの売り上げ個数は平均60個で、最低でも5個、最高では108個の売り上げがあった。気温は平均20℃で、最低気温が0℃、最高気温は42℃であった。

気温(x)とアイスクリームの売り上げ個数(y)の関係はおおむねy=2x+20となり、気温40℃の猛暑日には平均100個、誤差は±8個となった。

◇◇◇

うん、個人的にはこれで充分統計学【的な】論点は網羅できてると思う。わたしの授業だったら合格だ。SPSSなんか使えなくても構わない。

余談だけど統計学が大好きな昨今の学問世界にはアスタリスク病という病気が蔓延していて、調査結果が偶然とは考えにくいことさえ示せれば学問的成果だと考えるひとがとても多い。「充分強い因果関係があって、予測精度が高くて、偶然とは考えにくい」ことを示すのが大切だと思う。


この記事が気に入ったらサポートをしてみませんか?