見出し画像

統計学が最強の学問である (西内 啓)

(注:本稿は、2013年に初投稿したものの再録です)

 とても話題になっていますね。以前から統計学には興味をもっていたので、楽しみに読んでみた本です。

 タイトルづけも上手ですね。内容も、数式はほとんど登場せず、初心者に対する分かりやすさを意識した書きぶりなので、統計学の基礎レベルの予備知識があれば十分理解できると思います。

 そういった本書の中で、特に私の関心を惹いたところをいくつかご紹介します。

 まずは、「サンプリングが情報コストを激減させる」という章で、最近、大流行の“ビッグデータ”の統計学的意味に言及しているくだりです。

(p37より引用) しかしながら、彼らは果たしてデータがビッグであること、あるいはデータをビッグなまま解析することが、どれだけの価値を生むのかどうか、果たして投資するに見合うだけのベネフィットが得られるのかどうか、わかっているのだろうか。

 著者の考えは、目的を明確にすれば、統計学的手法によるサンプリングデータの分析により、ビッグデータ(全数)処理と同等の判断材料を極めて安価に得ることができるというものです。

 統計学的手法は稼動もコストも圧縮できます。著者からみると、施策の是非に関する机上議論をあれこれ延々と行っている状況は極めて非生産的なものに映ります。

(p120より引用) もしあなたの企業が過剰に失敗を恐れ、新しいアイディアを提案することよりも、それをもっともらしい理由で否定することのほうを賞賛するような体質になっていたとしたら、それはとてももったいないことである。ムダなリスクやコストを避けることはもちろん重要だが、統計学的な裏付けもないのにそれが絶対正しいと決めつけることと同じくらい、統計学的な裏付けもないのにそれが絶対誤りだと決めつけることも愚かである。

 とやかく言うぐらいなら、サッサと統計的手法(ランダム化比較実験)により試してみて、その結果で判断すればいいのにとの考えです。

 ちょっと本筋がから逸れますが、この点で私が思うのは「『判断』は『決断』である」ということです。
 決断は、それが間違っているかもしれないというリスクを包含したものです。リスクテイキングが決断の一つの側面である以上、決断するための判断材料に完璧を求めることは無意味。100%の情報が得られれば誰でも正しい決断ができる、30%程度の情報から採るべき道を示すのがリーダーです。

 統計学的思考は、より正しい判断を下すために極めて重要な要素です。昨今のICTの急速な発展により、ビッグデータに象徴される大規模データの統計処理やデータマイニング・テキストマイニングといった分析も至極簡易にできるようになってきました。

(p254より引用) テキストマイニングの背後にある技術は高度なものだが、その利用自体はツールを使えば誰でも簡単にできるものである。そしてそこからどう価値を生むか、ということになると、テキストマイニング以外の統計リテラシーが重要になるのである。

 私たちの身の回りには、「数字」を用いた主張・説明が溢れています。
 政府が発表する各種統計数値、マスコミによる世論調査やTVの視聴率、携帯電波のつながりやすさ・・・、それらの数字をどう解釈するか、そもそもその「1%の差」には意味があるのか・・・。

 本書の大半は統計的手法の概説で占められていますが、本書で著者が伝えたかったことはそれに止まりません。

 日常の社会生活の中で、私たちが目にする様々な数字が発するメッセージを正当に「解釈」し「評価」することが大切であり、そして、そのためには「統計リテラシー」を高めることが必要があること、この2つの指摘が著者からのメインメッセージだと思います。



この記事が参加している募集

読書感想文

この記事が気に入ったらサポートをしてみませんか?