DATA Saberを目指す物語(Day5_その2) Ord9編

引き続きOrd9に挑戦中。
気持ちOrd8よりは難しくはないかもと思ったが、
これはどうすれば?という問題があったので
メモ書き程度に紹介する。

出荷にかかる平均日数を週単位の推移で見せてください。社の方針として上方管理限界線(UCL:Upper Control Limit)を3σとして管理しているのですが、
Q8-1: この限界を突破して配送が遅延した週は何回ありましたか?
Q8-2: その週の配送先の市区町村を確認し、問題が起こった原因について調査してください。

こちらの問題はKTさんの動画や他のブログを参照頂ければと思います。
最終的には以下のように、標準偏差が3を超えてしまっている週で
どの地方が出荷が遅いのか分かればOK。

ただし、とあるブログ様の動画を参考に作成すると
一部の設問に答えらないことが分かった。
具体的には「出荷にかかる日数が多くかかっている市町村は、
果たして全国でも最もかかっているのか」どうかが回答が出来ない。

どういうことか説明すると、ブログ様の紹介通りに
出荷にかかる日数と市町村および地域との関係性を示してみる。

試してみれば分かるが、これだと降順しても並び替わらず
さらに最も日数がかかっていた富田林が4.130と
Q8-1の回答と一致していないことが分かる。

そのためKTさんと同じようなシートを作成しないといけない。
色々と試行錯誤を繰り返して何とか作成出来たのでご紹介。

「出荷にかかる日数」を行に追加し、不連続、メジャーを平均へ変更。
※出荷にかかる日数は以下の計算式で出せる。

都道府県、週(オーダー日)も行へ追加する。
するとよくわからない状態にはなるが、いったんはこれでOK。

あとは平均 出荷にかかる日数の並び替えをデータソース順に
チェック入れる。

すると以下のように、各地方の出荷にかかる日数が出てくる。

Ord9まで来たとしても操作方法が身に付いていなかったり
理屈がまだ分かっていないことが多い人も居ると思うので(私もその1人ですが)私と同じように迷った人に参考になれば幸いです。

この記事が気に入ったらサポートをしてみませんか?