統計学を活かす 解析しやすい数値化のノウハウ
見出し画像

統計学を活かす 解析しやすい数値化のノウハウ

はじめに

どうも熊野コミチです。

初めてのnote投稿になります。

私のことを知らない方も多いと思いますので、まずは軽く自己紹介。

私は普段製造業で製品開発を行いながら、youtubeやブログで発信を行っています。その発信内容は主に

統計学

についてです。

統計学は、かの「統計学が最強の学問である」から様々な仕事で使えるツールとして注目を集めています。

でもどうです?皆さんの職場で統計学って活用してます?

多分使えていない職場はかなり多いと思います。その理由でよく聞きそうな事としては

・数学的なことが難しい

・どういう時に使えば良いか分からん!!

的なところでしょう。

そのあたりは私のyoutubeで沢山解説していますので是非ご覧ください。

今回はね。そこじゃないんですよ。実は皆さんも薄々感じながらもうまく言い表せていない「統計学が適用できないポイント」ってのがまだあるんです。

それは、

うまく数値化出来ていない

という事です。

「いやいやそんな事はない、うちは外観不良を5段階で評価しているぞ!」

「うちも不良率をとって平均とか取っているんだ」

「うちだって、クレーム件数をちゃんと数えている!」

こんな文句が来そうなもんですが、ではその数値で統計的解析がうまくできていますか?

5段階評価の1と3の平均は2ですか?

不良率60%⇒40%と20%⇒0%は同じ難易度ですか?

クレーム件数って月1件とかじゃないですか?どうやって傾向をつかむんですか?

こんな感じで数値になっていても統計的に分析しやすい数値になっていないという問題が、実は統計学を使う上で極めて大きな障害となっているんです。

この記事では、統計学的に扱いやすい数値とは何か?そして私がこれまで品質管理や製品開発で統計学を実用するうえで、扱いやすい数値を得るためのノウハウを公開していきます。

1.統計的に扱いやすい数値とは

1-1.2つの変数

まず、上記で挙げたような数値がなぜ統計的に扱いにくいか解説いたします。数値というものは大きく2つに分けることが出来ます。それは

量的変数と質的変数です。

量的変数は量ることで得られる数値です。長さとか重さとかです。連続的に数値が変化していきます。

質的変数は数えることで得られる数値です。男女とか年齢とか順位とかです。数値と数値の間が空いています。10歳と11歳の間に10.5歳とかないみたいなもんです。

ここで重要なのは量的変数は四則演算(足し算、引き算、掛け算、割り算)が可能ですが、質的変数ではそれが出来ないという点です。

1位は2位の2倍凄いのでしょうか?男と女を0と1で表現すると0と1の平均に意味はあるのでしょうか?

こんな感じで質的変数は計算に使うことが出来ないのです。

当然、統計学にはこのような質的変数を分析するための手法は存在します。ですが、その手の手法はかなり難易度が高いものが多く、またR等の分析ソフトがないと分析出来ません。統計学の一般的な手法はその多くが量的変数を対象としたものなんです。

外観不良の5段階評価は、順位のデータです。つまり質的変数。分析がうまくいかなくて当然なんです。

1-2.パーセンテージの間隔

不良率はどうでしょうか。実はこれは二重の意味で分析しにくいデータです。

①:不良率は質的変数

②:パーセンテージは間隔が変わる。

不良率は数値が連続的に変化するから、一見すると量的変数に見えますが実は分子が不良数で質的変数、分母も生産数で質的変数なので実は質的変数に分類されます。質的変数が分析しにくいのは上述の通りですね。

さて、ここではもう一つのパーセンテージ固有の問題に注目しましょう。

以下のグラフをご覧ください。

ロジット

これは横軸にパーセンテージ、縦軸には変化させる負荷(ロジット変換後のパーセンテージ)みたいなものをプロットしたものです。

このグラフから言えることは、60%から40%に下げる負荷と20%から0%に下げる負荷は異なるという事です。つまりパーセンテージの計算はパーセンテージの領域によって傾向が異なるので四則演算の適用が難しいのです。

このような理由からパーセンテージ特に不良率なんかのデータは統計学に適用しがたいのです。

1-3.発生が稀な数値

品質を語るうえで最も関心が高いものは、顧客からのクレームでしょう。社内で発生する不良は損失にはなりますが、排除出来ればまだそこまでの材料費と加工費の損失だけで済みます。

ですが、クレームの場合はたとえ1件であろうとも製品の金額だけでなく信用の損失という回復しがたいダメージも負うことになるので、まぁシャレにならんわけです。

そんなクレームというものを防ごうと、そりゃ会社一丸になって頑張るわけですがそのクレームを統計的に分析して改善していくというのはとても難しいのです。

理由は発生が稀だからです。

まず統計学というものは、データが少ないと適用しづらいです。

層別で分けたり、分布を形成させたりするにも一定以上のデータが欲しい(トータルでn=30は欲しい)。

ですがクレームの発生なんて軽微なもんでも1件/月くらいのものでしょう(それより多いとヤバいと思う)。

1年を通したって12件です。

こんなの設備別や人別に分けても1つの設備もしくは人あたり多くて2件くらいなもんでしょう。

これじゃ分析なんか出来やしない。

クレーム

こんな理由でクレームに対して統計学の適用を断念している人は多いはずです。

2.量的変数で大量の情報量を得る工夫

これらのことから言えることは、量的変数で大量の情報量を得ることが重要という事です。

この記事では、統計学を品質管理、製品開発に10年間適用して業務を遂行してきた私のノウハウを公開しています。

教科書では取り上げていない、実務をする上で考え、実践していった生々しい知識になります。有料にはなりますが、具体例を交えつつ一般化した考え方も挙げますので、何度も読み返し、実践と改善を繰り返せばアナタの統計スキルは劇的に向上します。

また私に新しいアイデアやノウハウが蓄積すればこのnoteを更新していきます。買い切りタイプですので、割とお得です。

さて有料部分に入る前に何点か注意点があります。

・製造業(特に現場)よりの内容です。

私が適用してきたのはあくまで製造業においてです。特に品質管理や製品開発などになります。生産管理や営業、マーケティングにはそのまま適用は出来ないと思います。質的変数⇒量的変数へのヒントになり得るとは思いますが保証はしかねるのでそのあたりはご了承ください。

自分で改善サイクルを回そう

私が挙げるのはあくまで私の経験上でのものです。そのままアナタの現場に適用は出来ないでしょう。この記事をヒントに自分で絶対に数値化して分析出来るようにしてやるんだ!!という気概がないと無益なものになってしまいます。そういう一つの覚悟をもって臨んでください(そういう粘り強さみたいなものがないと何事も改善は出来ないと私は思っています)。

それでは先ほどの事例を中心に分析しやすい数値化を考えていきましょう。

この続きをみるには

この続き: 6,555文字 / 画像11枚

統計学を活かす 解析しやすい数値化のノウハウ

熊野コミチ

2,850円

この記事が気に入ったら、サポートをしてみませんか?
気軽にクリエイターの支援と、記事のオススメができます!