見出し画像

統計学でデータリテラシーを身に着ける

こんにちは。
税理士法人上坂会計 DXメンターチームの笹岡です。

突然ですが、一つ質問です。

あなたは、畑でスイカを育てています。
毎年、平均で大体6キログラムぐらいのスイカを収穫ができるのですが、もっと大きいスイカを収穫したいと思いました。
そこで、思い切ってちょっと高めの肥料に変えてみて、スイカを育ててみたところ、その年に収穫できたスイカは平均で6.5キログラムでした。

果たして、肥料を変えた効果があったと思いますか?


平均が0.5キログラム増えていますので、なんとなく効果があったように感じますよね?
しかし、質問に対する答えは「分からない」が正解なのです。

「え、なんで?」
そう思われる方もいらっしゃるかもしれません。

なぜ、「分からない」が正解なのでしょうか?
その答えは、統計学にあります。

皆さんは、統計学はご存じでしょうか?

もしかしたら、大学のときに講義を履修された、という方もいらっしゃるかもしれません。あまりの内容の意味不明さに、若干トラウマを持っている方も、少なくないかもしれません(自分の周りでも、そういう人がいます)

なので、統計を専門に仕事をされている方以外では、ちゃんと統計学を学ばれたことがある方というのは、意外と少ないのではないでしょうか。

しかし、ここ数年、ビジネスマンも統計学を学ぶべき、という話をちらほらと聞く機会が増えたように感じます。10年ほど前には「統計学が最強の学問である」という書籍がベストセラーとなりました。


なぜ、統計学が今重要なのか?
それは、PCやスマホ、センサ類などのIT機器が急速に普及していったことで、日々膨大なデータが生成されるようになったからです。

「データは21世紀の石油」とも言われておりますが、様々なIT機器から生成され、蓄積されていったデータには、多くの有益な情報が眠っています。それらを正しく理解し、活用するためには、データに対する正しい理解(データリテラシー)が求められます。

データリテラシーを持つために求められる教養こそが、統計学です。

言い換えると、統計学を正しく理解しておかないと、データから間違った情報を読み取ってしまい、その結果判断も間違えてしまうのです。

冒頭の質問を思い出してください。
見かけ上は、肥料を変えたおかげで大きいスイカが取れるようになったように見えます。
しかし、その判断が本当に正しいのでしょうか?
その年たまたま重量が増えたということはないでしょうか?
たまたまではなく、肥料を変えたことが直接スイカの重量を増やしたと判断するには、実はこれだけの情報では足りないのです。

少なくとも、以下の2点についてを考慮する必要があります。

  1. 肥料以外の要因(例えば気象条件)は他の年と変わっていないか

  2. スイカの平均重量は、年ごとにどれぐらい増減するのか

前者(1.)については、統計学について学んだことが無くても、分かるかと思います。例年に比べて気象条件に恵まれていれば、いつも以上に大きく育つのは、当たり前ですね。

では、肥料以外の要因が例年と比べて差異が無いのであれば、肥料のおかげで変わったと言えるのかというと、そうとは言えません。スイカも生物ですので、同じ条件なら必ずしも同じように生育するとは限らず、個体によって多少のバラツキはあるでしょう。

なので、重量の増加が肥料によるものではなく、このバラツキがたまたま重量が重い方に偏ってしまった。そんな可能性も考えられますよね。
この可能性を排除するために考えなければならないのが、後者(2.)です。

後者(2.)においては、スイカの平均重量が年ごとにどれぐらいバラついているのかを調べます。

年ごとのバラつき具合に比べて、今年の重量がどれぐらい平均からかけ離れているのかを見ることで、偶然かどうかを調べます。
例えば、平均重量が6キログラムで、毎年概ね平均重量5.8キログラム~6.2キログラムぐらいであれば、6.5キログラムは結構他の年と比べて平均よりかけ離れていると言えそうですよね。

では、このかけ離れ具合が仮に偶然そうなったのだとしたら、大体何パーセントの確率で起こるのでしょうか?
これがものすごく低い確率でしか起こらないのだとしたら、どうでしょう?
「そんな低い確率でしか起こらないのに、今回たまたま起こったなんてありえないやろ。やっぱりたまたまなんかじゃなく、肥料のおかげでスイカは大きく育ったんや!」と言えそうですよね。

これを調べる一連の調査を、統計学では仮説検定と呼びます。
今回の例で言うと「肥料のおかげでスイカが大きく育った」という仮説が正しいかどうかを、データ(毎年のスイカの平均重量)を基に検証する、ということをします。

仮説検定の詳しいやり方は、説明し出すと膨大な文章量となってしまいますのでここでは割愛させていただきますが、仮説検定を知っておくことは、データをビジネスに活用する上でとても有用です。

今回はスイカを例に書かせていただきましたが、ビジネスにおいても以下のようなシーンで仮説検定は活用できます。

  • ホームページのバナー画像を別の画像に変えてみたところ、問い合わせ件数が他の月に比べて数件増えた

  • 製造工程の流れを変更してみたところ、不良品率が数パーセント下がった

改善のための施策を実施しており、その結果確かに数字は良くなっています。しかし、それが偶然そうなったことなのか、施策を実施した効果によるものなのかは、実は仮説検定を通して検証してみないと、はっきりとは断言できません。

ちょっとしたことなら、わざわざ手間をかけて仮説検定をする必要はないですが、大きな投資を伴うような施策であれば、仮説検定を通して施策の効果検証を行わないと、間違った判断を下してしまう可能性があります。本当はたまたま成果が出ただけの施策を、効果があると信じ込んでどんどんお金を投入して推し進めたところ、全然効果が出なかった、ということにもなりかねません。

DXを実現するためには、データを上手に活用しなければなりません。データを活用するためのデータリテラシーを身に着ける手段として、統計学を学ぶことはとても有用です。

今回紹介した仮説検定以外にも、データリテラシーに関する様々な考え方、手法を習得できますので、自社のDXを推進するような立場の方であれば、是非勉強してみてください。

参考までに、一般財団法人 統計質保証推進協会が実施している「統計検定」という試験があります。データの専門家であるデータサイエンティストと呼ばれる職業の人は、最低でも統計検定2級相当の統計知識が必要、と言われています。皆さんはデータサイエンティストを目指しているわけではないかもしれませんが、「データに詳しい」とされる一つの目安にはなるかと思いますので、よろしければ挑戦してみてください。


今回の記事が、少しでも皆さんのDXの理解に役立てば幸いです。
弊社でも、企業のDX支援をお手伝いさせていただいております。DXについての相談を常時受け付けておりますので、お気軽にお問い合わせください。

弊社へのお問い合わせは、こちらからどうぞ

この記事が気に入ったらサポートをしてみませんか?