見出し画像

確かな検証を行う「傾向スコア」分析とは?ビデオ講義(無料)

因果推論の分析デザインのひとつ、「傾向スコア」で検索すると分析法を数式やRやPythonの分析コードと共に紹介頂いている専門的な内容や論文などがでてきます。

学術分野としては医療に関係するものが多くなっています。キーワード検索数チェックツールaramakijake.jpで調べた「傾向スコア」の月間検索推計数は480回でした。データ分析に詳しく、「消費者理会」というマーケターの夜会といったウェビナーを毎月一緒に行なっているマーケターの「松本健太郎」さん(1,000回)のほうが検索数が多いです。ちなみに私の名前「小川貴史」は590回でした。

検索数やコンテンツを見た限りでは、傾向スコア分析は研究者や専門家だけのものになってしまっていると思いました。

この分析はビジネスやマーケティングの意思決定に多いに役立ちます。私は主にインターネット調査による効果検証やコンセプト調査、顧客調査など、定量分析のバイアスを調整するのに活用しています。重要かつ大胆な意思決定には慎重な因果関係の考察が必要になります。傾向スコア分析を活かせる方は328万人はいると思います。1.6万人に調査した結果から商品開発、広告や販促、クリエイティブなど、広義でのマーケティング業務に関わる人数を推計した人数です。

調査結果(参考)「328万人のマーケターの皆さまへ!「顧客理解サイクルの作り方」」note  https://note.com/ogataka/n/n121abfb792d1

このnoteでは、マクドナルドやケンタッキーなど、身近なブランドのTVCMやネット広告、アプリによって、それぞれ売上がいくら増えているのか?因果効果を分析する演習で傾向スコア分析を習得する無料ビデオ講義を紹介します。日々ビジネスを動かしている方の意思決定の精度向上のお役に立てればと思います。(先行知見を作って頂いた先人への敬意を大前提として)この分析を研究に閉じず、ビジネスで積極的に活用する方が増える一助となれば幸いです。

2024年6月26日更新

新著「その決定に根拠はありますか?」Amazonでの販売を開始しました!

分析を実践し、楽しんで頂くために

私は数学や統計の知識で専門家と言えるレベルではないですが、広告会社で働いていた際に※MMMを知って以降、マーケティング投資の妥当性の判断や確かな効果推定など「マーケティングの重要な意思決定に役立つ」分析に特化して10年近く実践してきました。この分野では確固たるノウハウを確立しています。今までわからなかった真実がわかる様になり、それが日々増えていくので、分析が楽しくなり、実践を続けることができました。専門書や論文などの数式を読んでも良くわからない時は、実際のマーケティングのデータを当てはめて分析すると、なるほどと理解できることが多いのです。

※MMM(マーケティング・ミックス・モデリング):商品購買などへの影響を、同時に複数実施されているマーケティング施策やその他の要因を用いて(数式などの)モデルを作り説明することで、施策毎の影響を推定し、最適化試算まで落とし込む科学的アプローチ。

2018年にMMMの分析を体系化し「Excelでできるデータドリブン・マーケティングという書籍を出版。2019年末から講師を担当した宣伝会議のマーケティング分析講座を機に、講師の取り組みを本格化し2020年5月2020年4月までの2年間で個人向け700人、企業向け800人、のべ1,500人にマーケティング分析のオンライン講義を行い、分析をご理解頂くレクチャー法のコツを掴んできました。

勉強のための勉強はなかなか身が入りません。分析の講義は演習のテーマに興味を持って頂けるかが重要です。企業に分析ノウハウを共有するプロジェクトではその企業の意思決定のために実際に行った分析データを使います。10問のインターネット調査から自社と競合ブランドを比較して効果を推定できる顧客理解MMMの演習はウケが良いです。

今回のビデオ講義ではマクドナルドのTVCMによる2021年10月の店内の売上増加は8.6億円など、身近なブランドの施策の効果を推定する演習を用意しました。2021年10月末に2万人に行なった調査から、マクドナルド、ケンタッキー、モスバーガー、丸亀製麺、スシロー、ガスト、吉野家、7ブランドのネット広告、TVCM、アプリの効果(売上をいくら増やしたのか?)を定量化する顧客理解MMMの分析をExcelのVBAとEZRでサクサク実行します。

無料統計ソフトEZR(EasyR)


ここからは、「顧客理解MMM」で分かることを紹介します。

自社だけでなく競合ブランドのマーケティング効果まで把握できる「顧客理解MMM」

TVCMなどの広告を投下している企業の多くが、インターネット調査などを定期的に行い、ブランドの認知や好意、利用意向などの態度変容(ブランドリフト)を観測していますが、ブランドリフトによって売上がいくら増えるのか?と問われたら明確な数字を回答できるでしょうか?

顧客理解MMM(マーケティング・ミックス・モデリング)では、10問の調査で分かります。

消費者調査から分析するため、自社だけでなく競合ブランドの効果も推定することができます。TVCMなど投下コストが大きい施策を検討する段階では、競合の施策によって売上がどれだけ増えているか?この方法で定量化しています。どのブランドのどの施策がどのターゲット(性別年代)に効いているのか明確になります。注視すべき競合とそうではない(マーケティング施策がうまく機能していない等)競合が分かります。

2021年10月末に2万人にインターネット調査を行いました。以降本noteで示す調査はすべて当調査とします。外食チェーン7ブランドのTVCMによって増えた2021年10月の20~60代男女の売上を店内、デリバリー、テイクアウト(またはドライブスルー)に分けて推定し、比較します。

TVCM効果(2021年10月1か月)の推定

購買単価はモスバーガーとスシローは1,000円、ガストは750円、それ以外のブランドは500円として計算

なぜ、この数字がわかるのでしょうか?

①因果推論の「傾向スコア分析」

②確率モデルの「NBDモデル」

の2つの手法の併用で導くことができます。

①確かなブランドリフト値を推定する「傾向スコア分析」

TVCMやアプリなどのマーケティング施策によってブランドの利用意向がどれだけ増えたかを推定する際に、例えばTVCMを見た人々(介入群)と見ていなかった人々(対照群)の利用意向を単純比較して、その差分を、TV CMの効果と判断することはオススメできません。

ブランドロイヤルティが高い方のほうが、TVCMを覚えていて、かつ利用意向も高い傾向にあるなど、原因(TV CM)と結果(利用意向)の双方に影響を及ぼす要因によるバイアスが発生していることが多いからです。

こうした原因と結果の双方に影響する要因を交絡因子といい、それによるバイアスへの対策が必要です。傾向スコア分析では共変量という言葉を使います。(交絡因子と共変量の意味は厳密には違うのでビデオ講義で解説します)

無作為抽出の実験に近い状態を疑似的に作ってバイアスを調整する方法が傾向スコア分析です。英語ではプロペンシティスコアと言います。バイアスを補正するために分析者が共変量を何にするかを考える必要があります。分析法を汎用化した顧客理解MMMでは、

ロイヤルティ指標(好意度など)
メディア消費時間(TVCMの検証の場合はTV試聴時間)
基本属性(年収、職種、居住エリア、居住形態、年齢)

これらを共変量として採択しています。一番重要なものはロイヤルティ指標です。ビデオ講義の演習で効果を推定する施策(原因)はネット広告とTVCMとアプリです。結果は、利用意向TOPへのブランドリフトです。

5段階尺度で調査(利用したい/やや利用したい/どちらともいえない/あまり利用したくない/利用したくない)

たとえばマクドナルドのネット広告とTVCMを一年以内に見た、または現在アプリを利用していると答えた人の割合のうち、好意度TOPの方とそれ以外の方(好意度OTHER)ではこれだけ違います。

特に偏りが大きいのはインターネット広告とアプリです。TVCMも偏りがないとはいえません。他の6ブランドも同じ傾向です。好意度が高い人ほど原因となるTVCMを見た(と記憶している)傾向にあり、結果となる利用意向も高い交絡因子となるので調整が必要です。

分析方法

介入群となる確率を予測する分析(ロジスティック回帰分析など)を行い、それぞれの調査モニターに介入群に割り当てられる確率の予測値を付与します。これが傾向スコアです。確率なので0~1までの値を取ります。

基本の分析は傾向スコアをもとに介入群と対照群のサンプルのペアを作り2群のバランスをとる傾向スコアマッチングですがIPW推定量という、傾向スコアを元に重み付け計算を行う分析法も用いられています。重回帰分析が用いられることもあります。

ビデオ講義で紹介する分析法ではRのスクリプトを実行して全て(マッチング、IPW推定量、重回帰分析)の推定値を数秒で算出します。それを年代性別ごとに行い、EZRの出力結果をExcelに貼り付けてVBAで一気に集計します。

マクドナルドのTVCMによる利用意向TOPの増加の、単純比較と傾向スコア分析4種類の推定値です。

・PSM(ATT)傾向スコアマッチング→介入群の効果
・IPW(ATT) IPW推定量→介入群の効果
・IPW(ATE) IPW推定量→全体の効果
・IPW(ATC) IPW推定量→対照群の効果

2群の共変量のバランスチェックを行います。(0から±1の値に)標準化した2群の平均値の差を見て、推定結果の信頼性を確認します。

20代男性のTVCMの効果推定のバランスチェックのアウトプットです。調整後(Adjusted)の標準化した差が左右の点線の0.1以内に収まることが基準となります。学術分野によっては0.25を基準にすることもあります。L1からL4は好意度5段階のTOPから4段階です。


コンセプト検証の分析時や、アンケート回答者の偏りの補正にも活用

傾向スコア分析は施策の効果検証だけでなく、サービスやコミュニケーションのコンセプトの検証にも有効です。手軽に行えるインターネット調査から確かな実験に近い状態を作ることができます。また、顧客向けの調査では、アンケートに回答する人のほうがロイヤリティが高い人に偏る傾向があります。私の経験ではECサイトではアンケート回答者のほうが回答しない人と比較して年間LTVで2倍以上の開きが出るようなことが多く、母集団の代表性がありません。その偏りの補正にも活用できます。ビデオ講義ではそれら活用についても紹介します。

②ブランドリフトによるアクション(購買回数など)増加回数を推定する確率モデル

「あなたが最後に、〇〇したのはいつですか?(マルチアンサー)」という調査を分析して消費者行動の回数や人数を推計し需要を把握できる方法がガンマ・ポアソン・リーセンシー・モデルです。

消費者行動の確率モデルのNBDモデルの数式や活用方法が解説された、森岡毅氏と今西聖貴氏の共著「確率思考の戦略論」で紹介されています。

この分析を用いて利用意向TOPにブランドリフトした人を1人増やすことで増加するアクション(ここでは飲食)の回数を推定します。

調査設問の構成例

10問のインターネット調査から分析しています。

■消費者の最後のアクション(リーセンシーデータ)
■マーケティング施策関与
■ブランドやカテゴリー関与指標
■メディア利用時間

などで構成します。

ブランドやカテゴリーの関与指標(好意度など)とメディア利用時間は傾向スコア分析の共変量として活用します。NBDモデルの分析のためにマストなデータが最後のアクション(リーセンシーデータ)です。

こうしたデータから行う分析を「ガンマ・ポアソン・リーセンシー・モデル(GPRM)と言います。書籍で紹介された数式を使ってVBAでソルバーを自動実行して年代性別ごとに分析する方法をビデオ講義で共有します。

前述した外食チェーンの分析の場合は3カテゴリ(店内、デリバリー、テイクアウト)で最後に食べたのはいつか?をマルチアンサーで聞きました。7ブランドと、その他の利用を両方聞いて分析することで全体の需要と、各ブランドのシェアを把握できます。

マクドナルドのターゲットごとの分析結果が下記です。

男女ともに、年齢が若くなるにつれ、利用率が上がっています。利用人数と利用回数がもっとも多いのは店内です。次に多いのはテイクアウトで人数も回数も店内に迫ります。平均回数は1ヶ月に利用した方1人あたりの回数です。これはカテゴリー間、性別年代で大きな差はありませんがMという値が、かなり違います。1番Mの値が大きいのは店内の20代男性で0.72です。

Mは、ある一定の分析対象期間(ここでは2021年10月の1か月)において、当該ターゲット一人あたりアクション(ここでは飲食)が発生する回数の期待値です。

プレファレンスに対応する「M」

「確率思考の戦略論」では、「プレファレンス(消費者の選好性)」によって市場構造が決定する法則や、NBDモデルの数式などが紹介されました。MNBDモデルに関わる値でプレファレンスに対応するものです。

TVCMなどの施策による効果の金額換算を行うために、利用意向TOPとそれ以外の方の2つのグループに分けてターゲット(年代性別)ごとにMを分析し差分をとります。

利用意向2グループ(TOPとOHTER)のマクドナルドの店内のMの差分分析

※好意度や興味の5段階を使う場合もあります。

①の傾向スコア分析で導いたブランドリフト率からブランドリフトした人数が分かるので、上記のMの増分を掛け合わせることで、1か月あたりの売上の増加回数が推定できます。このケースでは同伴者と行くことも考慮して更に1.5倍の補正係数を乗じています。

2021年10月1か月のマクドナルドのTVCMによる店内の飲食回数の増加金額の推計

マクドナルドの平均購買単価を500円とすると店内の売上増加金額は500円と推定できます。

無料ビデオ講義

傾向スコアで確かなブランドリフトを推定し、さらにガンマ・ポアソン・リーセンシー・モデルによって導いたMの増分を掛け合わせれば、自社だけでなく競合のマーケティング施策の効果も金額換算値で推定できます。ご興味頂ける方は傾向スコア分析をぜひ体験なさってみてください。

傾向スコア講義

演習データの一部の2万人調査のローデータとクロス集計ができるExcelも公開します。集計シートの使い方はビデオ講義(YouTube)の42分~48分で解説しています。著作権の定める引用の範囲でご活用ください。

本note及び、上記で配布したExcel調査分析データの著作権は弊社に帰属します。引用の際には、出所として弊社名(株式会社秤)及び調査名称の明記をお願いいたします。データの一部または全部を改変すること、弊社の許諾なく調査データを分析したレポートを販売・出版することは禁止させて頂きます。
【調査概要】
調査方法:インターネット調査
調査対象者Freeasyモニター全国20,000人(20歳~69歳男女)各性別10歳刻み、各標本サイズ数2,000人。
分析対象者:19,413人(調査対象7ブランドを全て知らない方を削除)
調査期間:2021年10月29日~10月30日
調査実施機関/分析担当者:株式会社秤/代表取締役社長 小川貴史

24時間セルフ型アンケートツール「Freeazy」


確率モデルの講義は有料で提供してきた内容を基礎編実践編の2つに分け、基礎編は無料配信しています。

確率モデル講義(基礎編)

実践編は原則、企業向けに提供します。

2024年6月26日更新

新著「その決定に根拠はありますか?」Amazonでの販売を開始しました!