製造業は知らなきゃまずい平均とバラツキの話
こんにちは!中小製造業応援団のたつみです。
今回はデータについての話をしたいと思います。デジタルトランスフォーメーションを進める上でも、日々の改善をする上でも当たり前すぎる話ですが、近年製造業でも理解していない方々に会う機会があったので念のために書きます。これを読んで「今さらこんな記事書く必要ある?」と批判的にならない方、ご要注意ください。
平均はデータを代表するか
古い話ですが、この記事のタイトルを見てビックリしました。今検索して出てくるのはすごいです。
ちょっと、1,800万円もないですけど!と危うくツッコミたくなりましたが、どうせこういうことだろうとデータを確認したところ案の定でした。
中央値は1,054万円とやはり平均より低く、某アパレルの社長や3大キャリアグループの会長や宇宙へ行く予定の方などの超大金持ちが平均を引き上げているのです。なお、高齢者世帯(世帯主が60歳以上)の平均は2,400万円で、やはり持っている方は多いです。これも高額貯蓄の方が押し上げているとは言え、一般的に若い人たちより貯蓄額が多いのは確かのようですね。さらに、このデータでは貯蓄ゼロ世帯は除外されているので、実際の中央値はもっと下がります。
中央値の方がそのデータ集団の代表の値に、感覚的に近くなることは多いです。貯蓄額については格差が広がれば広がるほど平均値の意味はよくわからなくなります。
これも古いですが、他にもこんな例がありました。
はい?景気は悪いですが?インフレしてる感覚もないですが?と記事タイトルを見てビックリした記憶があります。
調べるとこんなことがわかりました。
・新築総戸数はバブル期の半分
・首都圏の比率が1991年約30%から2015年52%と高まった。特に東京区部が4%から24%と伸びている。秋田県では6年ぶりに新築マンションが着工した
・首都圏の平均価格は、1990年平均6,123万円から2015年平均5,518万と下がっている
単に、価格の高い首都圏でしかマンションが建たなかっただけです・・・。それを過去最高って表現のタイトルにするセンスを疑います。販売戸数は減少と確かに書いてますが、「半減」ぐらいの表現にしましょうよ、と言いたくなります。
平均価格で過去最高というのは計算上は間違いではないです。しかしその数値を代表値としてタイトルに扱うことにはものすごい違和感がありませんか。データをうまく利用して読み手をだますこともできるので、伝えるときには注意が必要です。
平均値はただの計算結果です。データの対象や分布によって大きく変わります。自分の理解の仕方で判断が間違うこともあるでしょうし、他人に誤解を与える示し方もできます。
バラツキの重要性
代表となる値は中央値の方が実体に近いことが経験上多いです。ですが平均値を使っても、分布やバラツキが分かっていれば問題ないですし、いずれにせよバラツキを一緒に見ないと判断を間違える可能性が高いです。実際に、統計では平均とバラツキの両方で分析をします。ではなぜバラツキを見るか、明確に回答できない方が多いので説明します。
問題はバラツキに表れる
製造業では毎日同じ工程で同じようなモノを作っています。その中で全部が不良になるわけではなく、何かあった時にだけ不良になるはずです。平均が不良ということは、(バラツキが小さければ)全部不良で、そんなことは普通ないですよね。平均はセーフでたまに不良が出るのが普通で、何かの条件がバラツいた時に不良となります。
これはものづくりの基本中の基本ですが、いくつかのクライアントを見ると、現場で働いている若い方は結構知らないことが多いです。だから私に依頼が来るのでしょうが、由々しき問題です。
さらに追加でバラツキの意味を考えます。メーカーは毎日何個も同じモノを作っているから平均という概念が生まれて便利なので使いがちですが、お客さんはどうでしょう。例えば、私が昔とあるメーカーのパソコンを買ったら初期不良があり、しかも返品交換に2週間かかると言われたことがあります。それから2度とそこのメーカーの製品は購入しなくなりました。
お客さんにとっては一期一会なんです。
特に最終使用者がそうなので、完成品メーカーから1個不良があったら「全数再検査しろ」とまで言われるのが今の状況です。つまり、バラツキがあって1人のお客さんに迷惑かける可能性があれば、全体にまで影響を及ぼす可能性があります。何万個も作ってたらそこまで気にしないことも、お客さんにとっては重要なことで、対応もまずければSNSで書かれます。それが怖いので全体に波及してしまうのです。
「問題はバラツキに表れ、特定顧客に悪影響が出る可能性があり、それが全部の取引に波及しかねない」というところまで製造業なら理解してもらいたいところです。顧客やビジネスを見ないから平均という概念にとらわれるのです。
まとめ
平均とバラツキ、正規分布、標準偏差あたりを正確にちゃんと説明できない方、ヒストグラムとボックスプロットを使ったことがない方、ちゃんと勉強しましょう。それでKPIが大切、とか言ってたらデータに遊ばれている可能性が高いです。
そしてデータへの感度を高めましょう。ワイドショーのスタッフは統計を知りません。ネットニュースを書いている人も統計なんて知らないです。ちまたにあふれるその辺のデータを使うときは、ちゃんと自分でデータソースやサンプリングなどまで理解するようにしましょう。そして天下の新聞社様のタイトルに踊らされないように・・・。