見出し画像

統計学の講師が教える 自分でコントロールできないものにはウマく付き合うと良いはなし

この記事を書く理由

この記事の『これを統計学の研修で申し上げていることに当てはめると……』の項目で記したものを、今回単独の記事にするために、再度書き直したものです。

わたしたちの生活は、常に意思決定の連続です。
そうした中で「やるのかい!?やらないのかい!?どっちなんだい!?💪」と判断を迫られたときに、統計学の考え方に基づく、居心地の良い人生を送る一つの方法をあなたにお伝えします。

すべてのことを自力で動かそうとせず、あきらめるところはあきらめて、ウマく付き合いながら行動してゆくことを目指すものです。

●おことわり●
この記事では、Excelや統計学のことにも触れますが、最小限の説明に留めるため、内容が不充分なところがあります。
拙著や、(2022年12月末時点)今後講座などの機会が設けられたらと考えています。

まず統計学の話から ~ データ分析の準備

この記事の結論とつながりますが、まず研修などで教えている話をします。
必ずしもここで説明する統計学の内容は覚えていなくても、統計学の考え方があれば、日常生活で誰でも応用できることの1つをお伝えします。

データを集めて分析をする目的

ここでは月別売上高に注目します。
売上高は一定でなく、増えたり減ったりします。
増えたり減ったりするから、その要因を探ったり、また売上が少なくなりそう(足らなくなりそう)とか、逆に売上が多くなりそうだとわかったとき、早めに対策を立てたいのです。

ここでは、過去の月別売上高の動きと関連する(※)項目として、広告宣伝費の動きを分析に採り入れて、売上の予測をしようというものです。

(※)統計学では「相関関係」と呼びます。
ここでは売上高と相関関係がもっとも強い変数(つまり項目)を分析に採り入れます

Excelで分析ができるように表を作って グラフを描く

さてこの図は、研修などでも使っているExcelの画面で、統計手法の一つ回帰分析のはじめの部分で説明で使っています。

左側の表の部分:
注目する値となる売上高はオレンジ色、それに関連して連動する値となる広告宣伝費は青色で塗っています。
右側のグラフの部分:
売上高と広告宣伝費との関連を視覚的に探るために、散布図というグラフを描きます。

月別広告宣伝費と売上高のデータ(左)、散布図(右)

特になじみのない方は、ここで回帰分析という名前や、分析方法などを考えず、忘れてしまっても良いです。
注目している数値項目(ここでは売上高)とその他の変数(ここでは広告宣伝費)との関係を利用して、注目している数値項目(売上高)を説明するための式を作ります。

ここでは月別の売上高の変化を探るので、上の図のように先頭に「年月」、「広告宣伝費」、「売上高:千円」のように、項目名を配置します。
すぐ下側から下方向へ、該当する内容を並べます。
2018年4月は、広告宣伝費が306,000円、売上高が79,000千円(7,900万円)だったことを表わしています。

このとき24か月間のデータについて、広告宣伝費と売上高の関連を見た目で把握できるよう、散布図というグラフで描いたのが右側の図です。

このデータからわかるのは、広告宣伝費を多く使った月は、多くの売上があることです。
逆にあまり広告宣伝費を使わなかった月は、他の月と比べて、売上が少なかったことがわかります。

散布図の横軸は広告宣伝費を、縦軸は売上高を配置しています。
点が全体的に右肩上がりになっているので、広告宣伝費と売上高との間には関連があるように見えます。

このことから、データのある範囲なら(※)広告宣伝費を使えば使うほど、売上は増えると言えそうです。

(※)本来ならば、データのばらつき具合など、検討することは他にもありますが、ここでは省略します。
なお実務では一般に、広告宣伝費のような1つの要因だけで決まることはまずありません。
複数の要因を分析に採り入れることを検討します。
(※)広告宣伝費のデータの範囲: 123,600円~440,400円

今後のアクションの見立てへ

上のデータから、月別の広告宣伝費を基に売上高を予測する式を求めます。
ここでは散布図に式を表示するだけにしますが、次のように求めることができました。

散布図に直線と数式を追加したもの

y = 0.2752x + 5063.5

このデータのために翻訳をすると、次のように表わすことができます。

売上高の予測(単位:千円)= 0.2752 × 広告宣伝費 + 5063.5

もし広告宣伝費を150,000円使うなら、上の式に当てはめて

売上高の予測(単位:千円)= 0.2752 × 150000 + 5063.5

これを計算して、46,337.66(千円)、つまり4633万円と予測することができました。

文字式のとき、「0.2752x」は、「0.2752」と「x」との間に掛け算の記号が省略されています。数字と文字と合わせるときは、掛け算の記号は省略して書く習慣があります。
また計算は、掛け算や割り算から先に計算し、その後に足し算や引き算を計算します。カッコがある場合は、カッコの内側を先に計算します。

更に売上を増やすには

ここで得られた式を基に、売上高をもっと増やすには……

広告宣伝費を増やすことです。

売上高の予測(単位:千円)= 0.2752 × 150000 + 5063.5

この式であれば、150,000円の部分をもっと増やすことを考えるのです。

もし広告宣伝費を250,000円かけたら、上の式の150000の部分に250000を当てはめ、

売上高の予測(単位:千円)= 0.2752 × 250000 + 5063.5

として、7,385万円の売上が見込めると言えそうです。


【いよいよ本題】日常生活への応用へ

この事例の場合、より多くの広告宣伝費をかければ、売上高が増やせることを説明しました。

これを、次のように置き換えて考えてみます。

意思決定をするのに、自分でコントロールできることは無いだろうか?と考えるのです。
売上高の予測の場合ならば、広告宣伝費をいくらにするかが、自分(自社・自店)でコントロールできる部分です。

つまり自分でコントロールできる部分と、自分ではコントロールできない部分に分けて扱うのです。

そして自分でコントロールできない部分は、必要以上に自分で動かそうとはせず、上手に付き合ってゆくのが、毎日の生活をより居心地良く過ごすことが期待できるのです。

【おまけ】y=●x+■の式を初めて見た方、忘れてしまったへ

母親が空の財布と共に、これから毎日100円のお小遣いをお子さんに渡すとします。
このときお子さんが1円も使わない場合、財布の中には毎日100円が貯まり続けます。

小遣いを渡す初日を1日目としたとき、財布に入っている金額は、1日目なら100円、2日目なら200円です。
日にちを「x(エックス)」、財布に入っている金額を「y」とすると、式は

y=100x

と表わします。

また財布を渡すときにあらかじめ1,000円札を入れたとき、式は

y = 100x + 1000

と表わします。
1000にあたる数字を切片(せっぺん)とか定数(じょうすう)、定数項と呼びます。

ほしいゲーム機があり、「早く買いたい」とお子さんから言われても、1000円の頭金を増やしてあげるか、お小遣いが貯まるまで待つようにするか、あなたはどちらを選びますか?

確実に毎日100円を渡しているのですから、頭金や臨時収入を期待して説得にパワーや時間を費やすよりも、待てば必要な金額まで確実に貯まる方を選ぶことを提案しています。


唯一の正解や100%を担保しない統計学

ただし、必ず待つことを選ばなくてはならない、という唯一の正解を示しているわけではありません
また統計学で得られた結果が100%誰にでも当てはまることを保証するようなことは、一切ありません。

統計学や数学を日常生活に活用する役割の1つは、過去の傾向から将来を予測したり、見立てをするための道具として使えることにあります。

結局 何をもって正解とするのかの基準を、自分で常に持っておくことから始まるのです。


【参考】データの把握までの流れ

わたくしの研修やセミナーでは、次のように説明しています。
次の図は、この記事のために作りました。

データ活用までの流れ ①何を知りたいのか? → ②どの項目に注目するのか? → ③同時に関連する項目はあるのか? → ④現状の把握をする → ⑤情報を整理して意思決定へ~検証へ

もしデータが無ければ、データを集めたり、探したりします。
総務省統計局などの行政から提供されるデータもあります。

記事執筆時点(2022年12月)では、総務省統計局などで提供されるExcel形式のファイルをダウンロードしても、すぐに集計や分析に使えるようになっていないものが多いものです。
集計・分析ができるための表に、我々が作り変えて活用できる必要があります。

データはあるけど、どこから手を付ければ良いのかわからない

わたくしの研修やセミナーでは、こうしたご質問を度々耳にします。
良く理解できます。
たとえば総務の方ならば、売上や労務管理のデータが日々集まってくるのですから、それをどのように料理して、意思決定に活かそうかと考えたくなります。

このご質問に対するわたくしの答えは、

そもそも順序が逆で、まず「何を知りたいのか?」を
明らかにしましょう

この時点で「社員の労働時間に偏りはないか?」、「売上高が変化する主な要因はなんだろう?」という程度までまず明らかになっていれば、更にデータは活用しやすくなります。
また組織では、データは意思決定に役立っていることが浸透しやすくなるのです。

何を知りたいのかがわかったら、その知りたいことについて、注目する項目を決めます。
「社員の労働時間」、「売上高」は数字で表わすことができますが、必ずしも数字で表わすことができなくても良いのです。
たとえば顧客リストのうち、キャンペーンで購入したかどうかならば、「購入した/しない」が注目する項目にあたります。

これを明らかにしてから、冒頭の分析に入るのです。


記事をお読みくださり、ありがとうございます! あなたのサポ―トは、今後更により良い記事を提供するための、大きな力になります!