見出し画像

統計学が最強の学問である

統計学と聞くと「とっつきづらい」「難しい数式が出てきて難しそう」という印象を受ける方も多いでしょう。

しかし、この本は難しい数式を長々と解説はしません。

この本が教えてくれることは以下の3つです。

✔️なぜ統計学を学ぶ必要があるのか

✔️統計解析の基礎

✔️状況に応じた統計学の手法

それではさっそく「統計学が最強の学問である」を解説していきます。

この本を読みたいと思った方は下記リンクから本を購入していただけます。


なぜ統計学が最強の学問なのか

統計学が最強の学問である理由は2つあります。

☑️データを集めて分析することで最速で最善の答えを出すことができるから

裏を返すと、データを集めずに勘と経験を頼りにしても間違った答えしか導き出せないということです。

☑️IT技術によって膨大なデータを高速に扱える環境になったから

ソフトウェアやハードウェア技術の発達によって飽和したIT業界に統計学がビジネスインテリジェンスやビッグデータといった形で流れ込んできました。


何でもビッグデータは間違い

現在、ビッグデータやAIといった言葉が流行しています。

その結果、様々な会社がデータ分析のアプリやハードウェアを入れたはいいものの費用対効果がないという状態になっています。

なぜこのような状態になるかというと、ビッグデータを分析して得られた結果(判断)にかけたコスト以上の価値がなかったからです。

これを防ぐためには分析して得られるであろう結果をあらかじめ想定し、その結果に対してどれぐらいまでコストをかけられるかを事前に考える必要があります。

1%の精度に数千万円をかけるべきでしょうか?

もし、精度を1%を改善することに数億円の価値があるならやるべきでしょう。

そうでなければ、サンプリング調査で十分です。

判断や行動に影響しないレベルの精度は無意味なのです。

重要なことは正しい判断に必要な最小十分のデータを扱うことです。


データをビジネスに使うための「3つの問い」

ビジネスにおけるデータ分析で重要なことは「その分析はかけたコスト以上の利益を自社にもたらすような判断につながるのだろうか」という視点です。

この視点をより詳細にするために自分に下記3つを問いかけてみましょう。

❓何かの要因が変化すれば利益は向上するのか

❓そうした変化を起こすような行動は実際に可能なのか

❓変化を起こす行動が可能だとしてそのコストは利益を上回るのか

この3つの問いに対して全て「YES」と回答できるのであれば、そのデータ分析をやる意味があります。


誤差と因果関係が統計学のキモである

「パンを食べる人が増えたので、犯罪が増えた」という相関関係に対して違和感を覚えますよね?

ここまで極端な例はあまりありませんが、世の中には何の意味もないデータが溢れかえっています。

つまり、意味のないデータとは因果関係が考えられていないもののことです(相関関係と因果関係の違いの例は下記の通り)。

このように、相関性はあっても因果関係がわからないものには注意すべきです。

因果関係の向きが分からないのは比較している集団が同じ条件ではないからです。

これを統計学的に解決する手段は2つあります。

☑️「関連しそうな条件」を考えうる限り継続的に追跡調査し、統計学的な手法を用いて、少なくとも測定された条件については「フェアな比較」を行う

☑️解析ではなくデータの取り方で「フェアに条件をそろえる」

しかし完全にフェアな比較を行うことは難しいです。この問題を解決するために「ランダム化」という方法があります。


「ランダム化」という最強の武器

全章で述べた因果関係を立証する方法としてランダム化比較実験という手法があります。

これは事象をランダムに抽出してそれに対する偏りを把握する方法です。

例えば、会社で研修をやる場合に本当にその研修には効果があるのかを測りたいとしましょう。

まずは研修の対象となる従業員をランダムに半分に分け、片方に提案された研修を受けてもらいます。そしてもう片方は通常業務に従事させます。

そして従業員パフォーマンスが上がるかどうかを定期的にウォッチします。

こうすることで因果関係の立証に必要なできるだけフェアな比較が可能になります。

ランダム化比較実験によって誤差があるものを科学的に証明できるようになりました。

しかし、ランダム化にも下記のように3つの限界があります。

☑️ランダム化を行うこと自体が不可能な場合

①サンプル数の制限

必要なサンプル数を手に入れられない場合は実験を行えない。

②条件の制御不可能性

条件を制御することができない場合、ランダム化比較実験を行うことができません。

例えば、大地震を体験した社員は精神的にタフになるという仮説を実証したいとしましょう。

この場合大地震という条件をコントロールできないのランダム化比較実験を行うことができません。

☑️行うことが許されない場合

①ランダム化によって人為的にもたらされる介入が有害である

②明らかに不公平なレベルで「ものすごくいい」ものと「それほどでもない」ものが存在していると事前に分かっている

例えば減税をした際の消費効果を測るために、国民の半分を減税するといった実験がこれにあたります。

☑️行うこと自体は何の問題もないが、やると大損する場合

①実験の対象が感情的に嫌悪感を抱いている場合

Amazonが顧客向けにランダムに商品の値段を変更して批判された実例があります。


まとめ

この本はビジネスマンがはじめに読む統計学に関する本としてぴったりだと思います。

私自身この本を読むまで統計をどのようにビジネスで活かすのかを全くイメージすることができませんでした。

もちろん本を読んだだけでデータ分析ができるようになるわけではないので、具体的な方法はこれから勉強していきましょう!

この記事が気に入ったらサポートをしてみませんか?