見出し画像

「統計学が最強の学問である」を読んで

はじめに。

私が勤めている会社では、データを収集しているもののそれを上手く活用できる人材がほぼいません。しまいには、なんのためにデータを集めるのか、それをどう利活用できるのかを知らないままにジャンジャンお金をかけてデータ収集に躍起になっています。このままではいけない!少なくとも自分が参加するプロジェクトに関しては、データの活用方法をイメージした上でどういったデータをどのタイミングで取得するのかを考えられる人材になりたいと思い、本書を手に取りました。

「統計学が最強」の理由

ずばり!
「どんな分野においても、データを集めて分析することで最速で最善の答えを導き出すことができる」
からです。
データと統計学を駆使することでどんな「良いこと」があるのかを本書では過去の実例とその時の解決方法を出しながら解説しています。
特に「ITと統計学の結婚」というワードが印象に残ってます。昔はデータを集めることがもっと労力がかかっていたが、IT技術の発展により、不特定多数のデータが取得可能になることで、統計学の真価が発揮されるというお話です。近年データ分析に注目が集まるのはこういった背景からなんですね。

ビジネスでの心得

本書ではデータ分析を実施しても具体的な行動を起こさなければその分析は自己満足でしかないと言っています。その中でも以下の3つの問いに「Yes」と答えられるかが重要になってきます。

⒈何かの要因が変化すれば利益は向上するのか?
⒉そうした変化を起こすような行動は実際に可能なのか?
⒊変化を起こす行動が可能だとして、その利益はコストを上回るのか?

これは心にグサっと刺さる部分でした。(我が社のことを言われているのかと思いました。)データ分析の結果から、仮に「前日が雨の日で当日が晴れの日にこの商品は売れる!」ということがわかったとしても、人はその状況を意図的に作り出すことはできない訳です。ならばそのデータ分析には大した意味がないのです。事実を知ることが利益に繋がるわけではないのです。そこを勘違いしてはいけないなと思いました。

分析手法概要

本書では恐らく有名どころの分析手法を大きく3つ取り上げていました。ここはかなり難しいところだったので、簡単な概要を記載します。

⑴ランダム化

これが最強の分析手法です。ランダム化実験の中でも特に有名のものに「A/Bテスト」というものがあります。例えば、ECサイトを作る際に2つのデザインの内どちらにするかを悩んでいたとします。その際はユーザーに対しランダムにAのサイトとBのサイトを見せます。その時のアクセスログから商品の売り上げやバナーのクリック率などを比較し、A,Bどちらのサイトデザインが優れているかを判断します。
このように無作為に得られたデータは「適切な比較」ができるのです。
統計学のすごいところはこの後で、A/Bテストによって得られた結果が偶然なのか必然なのかを数学的に確認します。
具体的には、「実際は何の差もないのに偶然そのような結果になる確率」すなわちP値を求めます。このP値が5%以下の時に、この結果は偶然ではないと判断します。

⑵層別解析
ランダム化ができない時によく作用される手法です。例えば、タバコと癌の関係性を調べたい時。ランダム化するなら、無作為に選んだ非喫煙者をタバコを吸わせるグループと吸わせないグループに分けて比較すれば良いです。ただその比較はすべきではないですよね。その時にこの手法を使います。「肺癌と喫煙の要因以外の条件がよく似た人」を集めて、比較することでタバコと癌の因果関係を導き出すというものです。ランダム化をするのは現実世界において意外と難しいものです。層別解析はランダム化に比べ、正確性は劣るものの、意思決定をする上では十分なエビデンスになると思います。

⑶回帰
回帰とは、データ間の関係性を示すもので、一方のデータから他方のデータを予測することができます。どの説明変数が最も結果変数に違いを生むのかを数値的に表すことができます。例えば「来店回数が多い人ほど、売り上げも高まるのだろうか」という問いを解明したい時。来店回数を説明変数に、売り上げを結果変数として回帰分析を行うと、この命題が正しいのかを導き出すことができるのです。
回帰分析には多くの種類があります。(複数の説明変数を同時に分析する重回帰分析や数値のような連続値以外を扱うロジスティック回帰分析など)
しかし、どの分析方法もデータ間の因果関係を明らかにするという点では共通しています。

感想

最初はこの本を読んだらデータ分析できるようになるかなあ。とか思ってましたが、全然そんなことはありませんでした。統計学は、分析手法とその使い方、誤差や偶然への対処方法など、学ぶべきことが本当に多いということを思い知らされました。
しかし、分析手法を学ぶことより、そもそものビジネスのゴールを見据えることの方が何倍も重要だということも学びました。
大事なのは自身の使命を知り、ゴールをイメージすること。
統計学はあくまでのそのゴールへの道標なのです。

この記事が気に入ったらサポートをしてみませんか?