![見出し画像](https://assets.st-note.com/production/uploads/images/126660325/rectangle_large_type_2_bea9235dea45c099b1d95ee3bc45d1cb.png?width=800)
統計学が最強の学問である 実践編⑤:ビジネスで統計分析する際の手順4つ
読書ノート(145日目)
年末年始の読書テーマである
「統計学が最強~」の2冊目として、
本日もこちらの本からです。
・終章:統計手法のまとめと仕様の手順
・ビジネスで統計学を用いる場合の分析の手順
手順①:重回帰分析/ロジスティック回帰で関連性を分析
手順②:結果の解釈
手順③:必要に応じて因子分析/クラスター分析で縮約
手順④:t検定やz検定でA/Bテストを検証
・分析結果からアイデアを考える3つの方法
(1)説明変数を動かせるものの場合(例:施策やブランドイメージなど)
回帰係数から「この説明変数を動かすことで
何円分のインパクトがあるか」を概算で予測する
(2)説明変数を動かせないが、ずらすことはできる場合
(例:性別、年代など)
現在の店舗への来店客層が男女比1:1の時に、
女性の割合が8割の店舗づくりを目指した場合、
そこから得られる売上インパクトを概算で予測する
(3)説明変数を動かすこともずらす事もできない場合
(例:天候、気温など)
売上は変わらないが、コストを下げて利益に繋げる観点で考える
雨の日の営業日の割合は減らせないが、
雨の日に合わせた仕入れや在庫を予測し最適化を狙う
・相関と因果を混合しないように注意する
「因果の向きが逆」ということも考えられる
・そのためにも、儲かりそうなアイデアが見つかったら、
最後はランダム化比較実験またはA/Bテストで検証する
(※以下は、補足情報&備忘メモです)
・「次の一歩」の統計手法①:アイデア探索の新手法
・時系列分析(ARIMAモデル)
・経時データ分析(混合効果モデルなど)
・生存時間解析(コックス回帰、ハザード比)
「一定時間あたり何倍の確率で起こりやすい/起こりにくい」
という結果が得られる
(例)「1年間の間に退会したか」だけでなく、
「同じ退会するにしてもどれぐらい早く退会したか」を解析
・「次の一歩」の統計手法②:縮約における新手法
・構造方程式モデリング
(アウトカムへの変数が直接的だけでなく間接的な関係性も分析)
・項目反応理論
・k-means++法
(従来より効率的で安定した分類に落ち着かせる事ができる方法)
・カーネルk-means法
(同じ半径のクラスターしか分類できない従来のデメリットを解消)
・x-means法
(一定の基準にそって最適な数にクラスターを分割する方法)
・「次の一歩」の統計手法③:ランダム化比較実験による検証の新手法
・統計的因果推論
(ランダム化比較実験ができない状況で
どう間違いなく検証するかという研究)
・周辺構造モデル
(傾向スコアを用いた手法の一つ)
今回で
「統計学が最強~」シリーズを
2冊読み終えました。
本書で様々な分析手法が登場する中、
ビジネスで統計学を使うならばと、
筆者が示してくれた手順が
非常に分かりやすかったです。
※分析手法の一覧表は
過去のnoteで紹介しています
・ビジネスで統計学を用いる場合の分析の手順
手順①:重回帰分析/ロジスティック回帰で関連性を分析
手順②:結果の解釈
手順③:必要に応じて因子分析/クラスター分析で縮約
手順④:t検定やz検定でA/Bテストを検証
この手順を参考にしながら、
私が実際にデータ分析をするならば
手順⓪:欠損値、平均値、標準偏差、最大/最小値の確認
手順①:相関行列で全変数の関係性を網羅的に把握
手順②:重回帰分析/ロジスティック回帰で関係性を分析
手順③:結果の解釈
手順④:必要に応じて因子分析/クラスター分析
→ここまでで分析レポートを作成しクライアントに報告
※レポート納品後の追加分析として、
手順⑤:t検定やz検定でA/Bテストを検証
というのが、パッケージ化された
分析のフルコースの1つにできそうです。
あくまで私の場合においてですが、
以下の2つが特徴かなと思っています。
・手順⓪と手順①でのデータの全体把握に
割と時間を掛けること
・A/Bテストの検証は、分析レポートを参考に
クライアントと一緒に施策案の仮説を作り
後日、施策を実施しデータを収集して検証
(既に施策を実施済なら傾向スコアを活用し
疑似RCTで検証という方法もあります)
そして、
今年の目標の1つでもある
「個人で仕事を頂けるようにする」
を叶えるためにも、
もしランサーズやクラウドワークスで
上記の分析パッケージを販売したら
いくら位の価格が妥当でしょうか…?
(手順⓪~④までの作業時間を
約10時間~20時間と考えると、
10万円~30万円くらいでしょうか…?)
24年3月末までは本業のプロジェクトが
大詰めなので時間確保が難しいのですが、
24年5月頃を目標に、分析パッケージを
一般販売してみようかなと考えています。
そのためには、4月中に分析レポートの
見本となるポートフォリオを作り…と、
まだ今年も始まったばかりですが、
早くも目標達成に向けた道筋が見えてきて
何だか嬉しい気持ちと、
やる気が湧いてきています!✨
ちなみに…
初詣のおみくじは大吉でした!🙌
ということで、今日はこの辺で!
次回からは「統計学が最強~」の
シリーズ3冊目「ビジネス編」を
紹介していく予定です。
それではまたー!😉✨
この記事が気に入ったらサポートをしてみませんか?