![見出し画像](https://assets.st-note.com/production/uploads/images/95698900/rectangle_large_type_2_f3b81713e5dacbea1c853d32f98dd20a.jpeg?width=1200)
相関性確認(1要素)/よごしてすとの実演2
傾向の評価の仕方について。
①任意の項目ひとつが何%以上(或は未満)のとき、そのデータ群で増菌が発生した確率を求める。
たとえばこんなかんじ。
Brixが 30%未満だと 開発品の38%で菌が増えた ・・・★
Brixが 40%以上で 開発品の10%で菌が増えた。
Brixが 50%以上で 開発品の2%で菌が増えた。
という実績が得られたとき、今後試作する開発品も、そうした確率を示すんじゃないかと考えるわけです。
開発品がBrixが45%だから、10%の確率で増殖するかな?
→Brixデータ群全体の増菌率は15%だから、安全性は若干安全寄りだな!
このあたりはIF関数で表せます。たとえば★印を表すとこんな感じ。
=if( 任意のBrix値のセル<30,38,"")
・・・・任意のセルが30未満だと38と表示。そうでなければ空欄。
そしてサンプル数が多くなるほど、商品群に偏りがなければ、増菌率のブレはまとまってくると思っています。
②項目ひとつを使い、単純回帰で評価してみる
たとえばBrixだけで評価してみようとしたところ次のような結果だとします。(値は違いますが、図にあるグラフのイメージです)
Brixが 30%未満 開発品の38%で菌が増えた
Brixが 30以上、40%未満 開発品の27%で菌が増えた
Brixが 40以上、50%未満 開発品の13%菌が増えた
Brixが 50以上、 開発品の 2%で菌が増えた
この結果を使い、横軸にBrix(%)、縦軸に開発品の増菌率(%)にした相関図を作成。
(sumif や countif などを知っていると、集計表に入力した値を入力したときにリアルタイムで相関図に反映できるようになるので便利です)
次に相関図にエクセル機能を使って、単純回帰の直線(記事トップの図)、直線式、r2を表示。
(特に増菌した)サンプルデータの散らばり具合、回帰直線の傾きの急さ(y=ax + bのaの部分)、r2の結果(目安0.6以上で相関あり)、作業現場の感覚や経験知識から、相関として価値があるかを評価します。
相関としての価値ありと考えるのであれば、回帰直線の式を利用し、今後、検討する商品について、Brixデータから、菌が増えてしまう確率にあたりをつけられるようになります。
「任意のBrix(%)」✕ 式の傾き(a) + 切片(b)= 増菌する確率
刻みの幅や、刻み数を変えることで傾向がより明確になる場合もあります。
ただこの考察では経験を踏まえることが大切です。
エクセルの機能や統計の知識にこだわりすぎると、現実との乖離し、結果に違和感を感じてくるので、(自戒を込め)気をつけないといけません。
一気に作り上げようとせず、向き合う回数を増やすのがおすすめです。
グラフや表を添付しにくいのが、なんとももどかしいです。
3枚くらいくっつけられると、説明しやすいんですが・・・
この記事が気に入ったらサポートをしてみませんか?