![キービジュアル](https://assets.st-note.com/production/uploads/images/9054210/rectangle_large_type_2_ca6319ed44b14bbe2b72ac329048b688.jpg?width=1200)
西内 啓氏 推薦「Excelでできるデータドリブン・マーケティング」まえがきと第1章#全文公開
【更新情報2024年5月26日】
「その決定に根拠はありますか?」
確率思考でビジネスの成果を確実化するエビデンス・ベースド・マーケティング
戦略を導く為の「エビデンスの作り方」をテーマに、これまで体系化してきたノウハウを紹介したマーケティング・インテリジェンスの書籍を出版致しました。5問の調査でTVCM(施策)→コンビニで商品を見た(要因)→売上がいくら増えたか?→年間16.67億円(効果)の様に経路ごとに構造的に効果を把握する国際特許(PCT)を出願した分析法など、確率モデルや因果推論をプロジェクトで実際に活用している方法を特典の動画講義も活用して実装レベルの知識まで提供しています。
1章まで全文公開
50万部を超える大ヒットとなった書籍「統計学が最強の学問である」
シリーズ著者の西内 啓氏 に推薦していただいた「Excelでできるデータドリブン・マーケティング」(拙書)のまえがきと第1章を全文公開します。
表紙の左上に「これからのマーケターはグラフの見た目より因果推論に注意すべきである」という西内 啓 氏のコメントがあります。
マーケターに必要な因果推論の知識とは何でしょうか?
マーケティングの現場では、因果推論の基礎となる知識を知らないため、施策の効果をはき違えているなど、誤った判断をしているにも関わらず、それが間違えであることに誰も気づいていないケースがたくさんあります。ほかにもABテストの結果から判断する際にその差が偶然やバラつきによって起こり得るものではないか検証しない、アンケート集計で有意な差がないのに有意義な傾向差を見つけたと勘違いするなど、危なっかしい意思決定の例を挙げたらキリがありません。
「Excelでできるデータドリブン・マーケティング」では、マーケティングROIを定量化して把握し予算配分の最適化を行うマーケティング・ミックス・モデリングなど、実務に役立つデータ分析の演習をしながら統計や因果推論の基礎的な知識を知ることができます。第1章は効果検証やデータ分析の種類と本書で行う演習を全て紹介する書籍全体のサマリーとなっています。
【無料YouTube講義】
クッキーレス時代のグローバルスタンダードの効果検証法、 MMM(マーケティング・ミックス・モデリング) の高機能な分析ツールが無料、オープンソースとして提供されています。 META社のMMMツールRobynの使い方をYouTubeで解説しています。
【まえがきと第1章を全文公開】
はじめに
本書はデータドリブン・マーケティングをテーマにした書籍ですが、昨今マーケティングの現場で話題になっているような、あらゆるデータを集めて分析し、その分析にAIを活用するといった先進的な内容を紹介するものではありません。マーケターが日々の意思決定をデータドリブンにしていくために必要な知識を補うことにフォーカスしたものです。 例えば、消費者アンケート結果などの定量調査を集計し考察する際に、特定のターゲットセグメントが平均より高いスコアだった場合、ただのバラつきや誤差でそのような差が生じる確率を考慮していますか?本書の演習で紹介する「独立性の検定」などの統計的検定を行ったほうが慎重な判断ができます。 例えばTVCMの効果検証で、放映前後の消費者アンケートの態度変容(購入意向率など)や売上の変化などから効果を推し計っていませんか?施策の実施前後を単純比較するやり方は、季節性などの施策以外の要因の影響を考慮できないなど、多くの問題を含んでいます。因果推論のためには正しい分析のデザインが必要です。本来マーケティングの現場で行う意思決定には統計や因果推論の知識が必要なものが多いのですが、そうした知識が浸透していないため、アンケート集計で有意な差がないのに有益な傾向差を見つけたと勘違いする、間違えた因果推論で施策の効果をはき違えているといったケースが見受けられます。 昨今マーケティングの現場では、ビッグデータマイニングやデータ分析におけるAI活用など先進的な取り組みが注目されていますが、それ以前に取り組むべき課題ではないでしょうか?本書はそうした状況を変えるために、マーケターに必要な統計や因果推論の基礎知識を「演習形式」で共有するものです。 筆者は過去、広告会社プランナーやデジタルマーケティングコンサルタントとして活動する中で、メディアプランニングに使用する調査データベースや消費者アンケート、ダイレクトマーケティングの顧客獲得や購買履歴、デジタル広告やWebサイトのアクセスログなどの多用なデータと向き合い、必要 な知識がない状態で様々な意思決定を行っていました。しかし、当時のデータ分析や調査による意思決定は間違いも多かったと思います。ターニングポイントとなったのは(株)電通ダイレクトフォース(現 (株)電通ダイレクトマーケティング)在籍時に時系列データ解析によってオフライン施策とオンライン 施策を横並びで評価できるマーケティング・ミックス・モデリング(以下「MMM」)を知ってからです。 当初は外部の専門家に委託してその分析を行いましたが、それを自ら会得するために統計や因果推論を学びました。それ以降、分析手法の引き出しが増え、マーケターとしての視野が格段に拡がりました。 そうした知識や分析スキルを共有するために、ExcelでMMMを行いながら学べる書籍を作りました。MMMは本来、専門家によって提供される高度な分析サービスです。統計学に初めてチャレンジする方がこれを習得することを目指した無謀なチャレンジです。Excel VBAで組んだマクロとExcel アドインの演算機能の「ソルバー」を用いるなど、分析作業を効率化するための工夫を凝らしましたが、 それでも本書の全ての演習を終えるのに半日から1日(4〜8時間)前後はかかると思います。それでも、MMMや統計を学ぶ上で筆者が費やした膨大な時間の浪費は避けていただけるはずです。
これまで、統計になじみのない人間がMMMを学ぶ教科書はありませんでした。難解な専門書から手探りでヒントを探しながら学んできたため、筆者は少なくみて1,000時間は費やしたと思います。そうした経験により、分かりやすさにこだわり、統計関連の書籍にありがちな数式を用いた解説を極力減らし、演習で実際に分析をやってみながら学ぶ構成としました。詳細な知識は「統計WEB」や参考文献を案内するようにしています。 本書は統計やデータマイニングを学びたくなったマーケターが「専門書の壁」を越えて、生きたノウハウを身につけてもらうための「ビジネス専門書」を目指しました。
![画像1](https://assets.st-note.com/production/uploads/images/9052912/picture_pc_c83da88339ddd22562b81538b47f35eb.jpg?width=1200)
演習はMMMだけでなく「エクセル統計」体験版を用いた顧客分析の演習(数量化2類やクラスター分析等)も追加しました。最新のデータ解析ツールやシンジケートデータを紹介するコラムも入れました。
![画像2](https://assets.st-note.com/production/uploads/images/9052914/picture_pc_b0056b1ca2ed4bee30ec0142635069e0.jpg?width=1200)
筆者が開発したExcelの「MMM_modeling」Bookと「MMM_simulation」Bookを用いて皆さん自身のデータも分析できるようにしました。MMMはマーケティングの「全体最適」をテーマにされている方には有益なヒントになるものです。オンラインとオフラインの施策またはチャネル全体でのマーケティングの全体最適を模索する企業のマーケティング責任者や経営者、またはそれを支援するコンサルティング会社やエージェンシーのマーケターに役立つものになったのではないかと思います。 皆さんが手掛ける(または支援する)ブランドを成長させるために必要なデータ活用とは何か?データドリブン・マーケティングのロードマップを描く、またはそれを支援するためにマーケターの視野を広げるきっかけになればと思います。
2018年10月
![画像3](https://assets.st-note.com/production/uploads/images/9052975/picture_pc_1c253620fc3725fcd75c597c1d999232.jpg?width=1200)
日本語で〇〇ドリブンと使われる場合は「〇〇に突き動かされた」という意味から転じて、「〇〇 を起点にした、〇〇をもとにした」と使われることが多いそうです。「 データドリブン・マーケティング」とは、その言葉から直訳すると「データを起点にしたマーケティング」「データを元にしたマーケティング」です。ネットで検索すると、「様々なデータを作成、収集、見える化、活用するPDCAを回していくことで、ビジネスを成長させる」「データから導いた示唆を元に実行に移す」 といった説明を目にします。データを元にアクション(マーケティング施策)を実際に行い、改善 するPDCAが前提となっており、それを回していく際の指標となるKPIとアクション(マーケティ ング施策の実行)は対になるものです(図1-1-1)。
![画像4](https://assets.st-note.com/production/uploads/images/9052918/picture_pc_511fa2ec3cf52125aa1085753502ae26.jpg?width=1200)
マーク・ジェフリーは著書『データ・ドリブン・マーケティング 最低限知っておくべき15の指標』 で、米国での実例を元に「ブランド認知率」や「解約(離反)率」などのマーケティング業務にお ける重要な15の指標の活用の仕方について、具体的な例を用いて丁寧に紹介しています。マーケターがデータ分析によるPDCAを模索するためのヒントを得られる内容となっています。
【参照文献】マーク・ジェフリー(著)、佐藤順、矢倉純之介、内田彩香(共訳)『データ・ドリブン・マーケティング』ダイヤモンド社、2018年
マーケターの多くは売上数や売上金額、顧客調査によって導きだした「ブランド認知率」、Web マーケティングの「コンバージョン率」や「クリック率」など多様な指標を参照しています。テクノロジーの発展に伴い、より多くのデータが得られるようになったことで、多様な指標に翻弄され、 全体最適やイノベーションのための重要な意思決定を見失い、部分最適に陥っているマーケターや マーケティング組織を多く見かけます。 分析とは主に複雑な事象を細かく分けて見ていくことであり、分析の反意語は統合または総合です。重要な意思決定には、分析によって得た示唆を統合または総合する力が必要です。そうした力を養いましょう。 本書では、ECの集客などインターネットに限定した「Webマーケティング」など特定のマーケティング施策に対応する分析法ではなく、オフラインとオンラインの全てのチャネルにまたがる最適化に対応する分析法として、 マーケティング・ミックス・モデリング(以下「 MMM」)を中心にした演習で全体最適をテーマにしたノウハウを共有することを目指しました。
![画像5](https://assets.st-note.com/production/uploads/images/9052977/picture_pc_b5f8075e8817d30e2b06e2377a612965.jpg?width=1200)
筆者はこれまで自身が講演したセミナーなどをきっかけに多くの経営者やマーケティング担当者と会い、データをどのように活用すべきかといった相談を受けてきました。データドリブンなマーケティングへの変革の必要性を感じているが、何から着手したら良いか分からないといった悩みを 多く聞きました。また企業でデータサイエンティストとして活躍する方は、経営者や責任者のデータ分析の理解不足についての課題が多い印象がありました。 「エクセル統計」を提供する社会情報サービス社(以降SSRI社)が2017年8月に実施した「社会人の方へ統計に関するアンケート」で「あなたは次にあげる用語をご存知ですか、おおよその意味が分かるものをすべて選択してください。(複数選択)」 という問いに対して「重回帰分析」を選択した方は1割に満たなかったそうです(図 1-2-1)。
![画像6](https://assets.st-note.com/production/uploads/images/9052922/picture_pc_dbf7ca5b4b98fb54d6a07e1d014719e6.jpg?width=1200)
重回帰分析は本書で紹介するMMMの分析にも用いている手法です。同アンケートに実際に使いこなしているか?という質問はありませんでしたが、おそらく5%前後だと思います(過去筆者が開催したセミナー参加者アンケート等をまとめた時、その程度でした)。マーケターのうち仮に重回帰分析をしている人が5%だとして、それを「データを扱える人」の基準とした場合、残り 95%の意思決定者または実行者が「データを扱えない人」では、日本のマーケティング組織が本質的な「データドリブン・マーケティング」を推進することは難しいと思います。データサイエンティストが有益な示唆を導いても、意思決定者または実行者がそれを理解して実行できなければ意味がありません。スペシャリストとしての「データサイエンティスト」の育成も大事ですが、今、それより大事なのは95%のマーケターの分析リテラシーの底上げをすることなのです。
Column 「データサイエンティスト」に必要なスキルセット
「 データサイエンティスト」に求められるスキルセットは広範なものです。一般社団法人データサイエンティスト協会及び同協会スキル委員会が2015年11月に発表した「データサイエンティスト スキルチェックリスト」の第1版ではその定義が記載されています(図1-C-1)。 ここではデータサイエンティストのスキルレベルを4つに分けて考えられており、業界を代表するレベル(Senior Data Scientist)、棟梁レベル((full) Data Scientist)独り立ちレベル(Associate Data Scientist)、見習いレベル(Assistant Data Scientist)としています。「データサイエンティスト」に求められるスキルは広範なものです。 マーケターが必ずしもデータマイニングやデータエンジニアリングを網羅する「データサイエンティスト」を目指す必要はないと思いますが、少なくとも本書演習くらいの内容は経験しておくべきだと思います。
![画像7](https://assets.st-note.com/production/uploads/images/9052936/picture_pc_c2eefdccf942cecbe754d70a468bf469.jpg?width=1200)
![画像8](https://assets.st-note.com/production/uploads/images/9094998/picture_pc_4944ed3273ceee5111360bad6e8d84b9.png?width=1200)
マーケティング施策の効果検証法は「準実験」と「MMM」の2種類に大別されます。それぞれ の手法の分析の元になるデータとして「シンジケートデータ」の活用も重要です。効果検証の精度 を高め、施策の真の投資対効果(ROI)を正確に把握することで、積極的なマーケティング投資を 行いブランドの成長軌道を描きやすくなりますが、適切な形でそれを行うことは容易ではありません。 「準実験」による効果検証は、日本のマーケティングの現場で最も良く行われています。例えば TVCMの効果を検証する際に、実施前後の調査で購買意向率の変化を調査して比較する、TVCM 接触者(介入群)と非接触者(対照群)の比較をするといったことです。介入群が仮にTVCMに接触していなかったらという反事実を対照群で代用し、その2つを比較することで効果に興味のある施策の介入効果を推定する方法です。最も確実な方法は介入群と対照群を施策介入以外の条件を 完全に同一な状態にして比較する実験です。そうした実験を「対照実験」といいます。対象者に介入を無作為に割り付けるランダム化比較実験が代表例です。医療分野で実験というと、多くの場合、 ランダム化比較実験のことを示します。治療対象者AB群のうち、Aには治療をするがBには治療をしない実験が倫理に反する場合や、多大な時間や手間がかかることなどから、ランダム化比較実験ができない状況は多いです。マーケティングの効果検証ではランダムに抽出したグループのうち一方にだけTVCMをリーチさせるといったことはできません。
![画像9](https://assets.st-note.com/production/uploads/images/9052995/picture_pc_df9a23bce8a81f19e0e145ea0fa616c7.jpg?width=1200)
マーケティング施策の効果検証を「対照実験」と呼べる状態で行われることはあまりないため、 そうした場合に消費者パネルからTVCMに接触した人としていない人を抽出し比較するなど、実験ではなく観察されたデータから対照実験と相応の状況を作り比較する方法が「準実験」です。「準 実験」は正しくデザインする必要がありますが、マーケティングの現場では明らかに比較してはい けない状態でそれを比較し、施策の効果(因果関係)を判断しているケースを多く目にします。 「MMM」は日本のマーケティングの現場の効果検証のスタンダードではありませんでしたが、 昨今、注目が高まり利用する企業が増えています。数理モデルや仮想現実のシミュレーションによっ て効果を定量化するものです。MMMは同時に実施している複数の施策の効果を定量化する時に 特に役立ちます。Webマーケティングの発展に伴い、課題となっているのはTVCMによるEC売上の増加効果などのクロスチャネルの効果把握です。例えばMMMによってオフラインチャネル(実店舗やコールセンター等)とオンラインチャネル(EC等)の売上をマーケティング施策などの要因によって説明する統計モデルを作り、施策の1単位を増やすと売上がいくら増えるか?それぞれの介入効果を推定し定量化することで、オンライン施策とオフラインの施策を横並びで評価することができ、TVCMによってECの売上がいくつ増えるかといったクロスチャネルの効果把握もできます(ただし、信頼できる統計モデルを構築できればという前提です)。時系列データ解析によるオンライン広告オンライン広告統合分析ツール「XICA magellan(サイカ マゼラン)」などのツールも普及してきて、MMMはだんだんと浸透してきました。しかし、マーケター全体の統計リテラシーが低いため、外部専門家または社内のデータサイエンティストが高度な分析を行っても、意思決定者の理解が得られず、分析結果が実行に落ちないケースもあったと思います。
![画像10](https://assets.st-note.com/production/uploads/images/9095011/picture_pc_a615221239aeecb3e96ecb3a188125ac.png?width=1200)
Column True Lift Model™(トゥルー・リフト・モデル)
(株)電通デジタルは2018年9月12日にランダム化比較実験を応用し、同一の条件のユーザーの中から介入群と対照群を無作為に抽出し、広告接触ユーザーの全 CVRの中から、広告接触がなくても自然とコンバージョンに至ったであろうユーザーのCVRを適切に差し引いて、これを「True効果」として検出・評価する「True Lift Model(トゥルー・リフト・モデル)」を開発し、提供を開始しました( 図1-C-2) 。
![画像11](https://assets.st-note.com/production/uploads/images/9052944/picture_pc_ab29250e0dab74bb5a9cc8a1e148985d.jpg?width=1200)
「従来のデジタル広告の評価は、広告の接触者がどれだけクリックをし、購買などの成果に至ったかを評価するモデルが一般的でした。その結果、購買する確率の高い既存の自社サイト来訪者に対するリターゲティング広告に広告予算が偏重するケースが多くありました。しかし、このような施策のターゲットとなるユーザーは既に購買検 討意向度が高いため、仮に広告接触がなかったとしても購買に至る可能性が高く、その全てを純粋な広告による効果として捉えるには課題がありました。」(同社リリースより引用)「True Lift Model(トゥルー・リフト・モデル)」 は元から商品に対する親和性のあるユーザーではなく、 広告接触があることで購買に至る可能性を探ることで"広告接触があるからこそ購買などの成果に至る"態度変容しやすいターゲットユーザーの発掘を目指すものです。 デジタル広告は成果地点となるアクションの手前、ユーザーにとって最後の関与となるラストクリックを基準にデジタル広告を評価する仕組みが一般的です。ラストクリックの評価だと、商品やサービスの認知のきっかけとなった広告の評価が過小評価されるリスクがあるため、最初や中間の関与(クリックまたは広告接触)を評価するためにアトリビューションという分析も行われていました。筆者もデジタル広告運用者として、過去そうした支援をしていましたが、おそらくそうした取り組みにしっかりとチャレンジした経験があるのは大規模な広告投資を行う一部のリテラシーの高い広告主に限られると思います。デジタル広告の評価モデルに疑問を持たずに媒体管理画面 を盲目的に信じて運用している企業のほうが多いと思いますので、リターゲティング広告などの刈り取り型の広告施策に予算が偏るのも頷けます。日本は海外と比較して、 リターゲティング広告比率が高いと言われています。本来は広告を出しても出さなくても購買に影響のない広告配信に余計に投資している可能性があるのではないでしょうか? 「True Lift Model(トゥルー・リフト・モデル)」はランダム化比較実験を応用することで、"広告接触があるからこそ購買などの成果に至る"因果関係を追及し"広告接触があるからこそ購買などの成果に至る"態度変容しやすいターゲットユーザーの発掘を目指すもので、同社では 「電通グループ独自のPeople Driven DMP※と連携したユーザー属性の分析においても、「True効果」を検証する」としています。日本のデジタル広告の価値を新たな視点で評価する意欲的な取り組みだと筆者は捉えます。
【参照URL】(株)電通デジタル True Lift Modelプレスリリース紹介ページより(https://www.dentsudigital.co.jp/release/2018/0912-00315/index.html)
![画像12](https://assets.st-note.com/production/uploads/images/9052947/picture_pc_8669e81b24115bd5ce4c9acafea3045a.jpg?width=1200)
![画像13](https://assets.st-note.com/production/uploads/images/9053018/picture_pc_6d30f377913814b94f6638009a0c14ba.jpg?width=1200)
TVCMの放映前後でアンケート調査を行い、購入意向率などの差分を比較する方法はマーケティ ングの現場で良く用いられています。(中室、津川:2017)は共著『原因と結果の経済学』で単純 に広告を出す前後で結果を比較する手法を「前後比較デザイン」といい、時間とともに起こる自然 な変化(トレンド)の影響を考慮することができないことや、平均への回帰を理由にあげ、広告と 売上の因果関係を明らかにすることはできないことについて指摘しています。同書ではそれを改良 するために介入群と対照群のそれぞれにおいて、施策の実施前後の2つのタイミングのデータを入 手して分析する「差分の差分法」や、因果推論を行うべき結果に対して直接の影響はないが、原因 に対しては影響があり、間接的に結果に影響を与える第3の変数を用いた「操作変数法」、介入群 によく似たペアを対照群の中から選びだすことによって2つのグループを比較可能なものとする 「マッチング法」、観測可能な変数がある閾値を超えたときにその閾値前後でのYの不連続的な変 化の大きさから介入効果を推定する「回帰不連続デザイン」、本書で紹介するMMMに用いる「回帰分析」など因果推論を行うために必要な様々な分析法を紹介しています。 「差分の差分法」を用いてTVCM実施前後で興味のある指標を比較して介入効果を推定する場合はTVCM接触者グループ(介入群)とTVCM非接触者グループ(対照群)それぞれの実施前後の指標(認知率や購入意向率等)を比較します。図1-3-1のケースでは、介入群の実施後の増加分5%から、対照群の増加分2%を引いた3%の増加をTVCMの介入効果と考えます。
![画像14](https://assets.st-note.com/production/uploads/images/9053020/picture_pc_533a0fcb500b63c842358396dc548c49.jpg?width=1200)
「差分の差分法」では介入群に対して介入が行われなかったケースを仮想したBからAを引いた 値がDからCを引いた値と一致する「平行トレンド仮定」を満たすように、介入群と対照群を設定する必要があります。 介入群と対照群を比較可能にするために行う調整法のひとつが「マッチング法」です。例えば、 健康食品の広告を健康雑誌に出した際に購入意向への介入効果を推定するケースにおいて、アンケートの広告閲覧有無で介入群と対照群に分けた場合、健康意識の高い人ほど健康雑誌の閲読率が高く当該広告に接触しやすいため、介入群は健康意識が高い方に偏ることが考えられます。こうした時に介入群の購入意向率が15%で対照群の購入意向率が5%だった場合、その差分10%が雑誌広告の介入効果とは言えません。介入群に健康意識の高い人が多く含まれることが健康食品の購入意向率を押し上げている可能性が考えられるためです。こうした状況で介入群と対照群の偏りを補正して比較可能な状態にする方法がマッチング法です。その手段のひとつとなる「傾向スコアマッチング」は、ロジスティック回帰などの統計解析でそれぞれの標本が介入群に割り付けられる可能性を「傾向スコア」として数値化し、その値を元に介入群の標本と似た標本を対照群の中から選びだしペアを作りマッチングしていくことで介入群と対照群の偏りを補正するものです。
また、介入群と対照群の偏りが健康意識だけの場合はそれが高い人と低い人を分けた層別分析で も比較可能なものとできます。準実験を行う際は適切な実験デザインが必要ですが、マーケティングの現場では本来比較してはいけない介入群と対照群の差分から介入効果を推定しているケースを 多く見かけます。因果推論の基礎や準実験のデザインをマーケターの共通言語にしていくため、ぜ ひ参照文献を読んで頂ければと思います。因果推論の基礎について知ることができます。巷に流れ るニュースや政策、マーケティングで行っていた意思決定などについて見直す機会になると思いま す。もう一冊参考文献として『データサイエンス「超」入門 嘘をウソと見抜けなければ、データ を扱うのは難しい』を紹介します。巷にあふれるニュースやウェブ検索でヒットする情報や専門家 の論考など、データの読み解き方について間違えたものが多いことについて指摘し、データに注目 し(因果推論に限らず)「嘘を見抜く技術」を紹介するデータサイエンス入門書です。『原因と結果の経済学』と『データサイエンス「超」入門 嘘をウソと見抜けなければ、データを扱うのは難しい』はマーケターに重要な気づきを与えてくれるでしょう。
【参照URL】統計WEB ブログ「層別分析とは」(https://bellcurve.jp/statistics/blog/14333.html)
【参照文献】中室牧子、津川友介(著)『原因と結果の経済学』ダイヤモンド社、2017年
松本健太郎(著)『データサイエンス「超」入門 嘘をウソと見抜けなければ、データを扱うのは難しい』毎日新聞出版、2018年
![画像15](https://assets.st-note.com/production/uploads/images/8951161/picture_pc_0438e8345880237e7b8ffd8ff3d52fc7.jpg?width=1200)
![画像16](https://assets.st-note.com/production/uploads/images/9053028/picture_pc_fd962144768203a88b12a04bb46cadb4.jpg?width=1200)
売上の変化を見る時やTVCMの接触と購買への影響などを把握するためのデータとして、シングルソースパネルの活用を推奨します※。 これは同一の調査対象者から、購買・広告接触・ライフスタイルなどの多面的情報を採取したデータのことを指します。例えばインテージ社のシングルソースパネルではPC、モバイル、TVなどのメディア接触ログ、属性/意識・実態のアンケート回答と消費財の購買履歴ログを収集していま す。これらを活用することで、例えば、TVCM放映後にアンケートで「商品Aを買いましたか?」 と聞かなくても、同モニターのうち広告接触者と非接触者の購買率の差分を比較することなどが可能となります。
![画像17](https://assets.st-note.com/production/uploads/images/9053036/picture_pc_c2f7612562a968d196fb7254a87323bc.jpg?width=1200)
![画像18](https://assets.st-note.com/production/uploads/images/9053042/picture_pc_ba68b7c90b66563438c25276dac36cdc.jpg?width=1200)
MMMは数理モデルや仮想現実のシミュレーションによって効果を定量化するものだと説明しましたが、もう少しかみ砕くと「マーケティングゴールとなる商品購買などへの影響を、同時に複数実施されているマーケティング施策やその他の要因を用いて(数理モデルなどを用いて)モデル化して説明することで、施策ごとの介入効果を推定し、効果の最大化といった最適化試算に落とし込む分析手法の総称」です。 日本では「MMM=時系列データ解析」と説明されることが多いのですが、エージェントシミュレーションという高度な手法も、欧米ではよく用いられています(欧米製でそうした分析を行うソフトがいくつか提供されています)。エージェントシミュレーションでは、現実で得られた消費者行動特性をルール化し、それを元にしたエージェント(消費者)の行動を仮想空間上で再現するモデルを作ります。日本製ではNTTデータ数理システムが提供する「S4 Simulation System(エスクワトロシミュレーションシステム) ※」を用いてマーケティングの分析に活用した事例があります。 本書で紹介するMMMはエージェントシミュレーションではなく、時系列データ解析によって行うものです。目的変数を説明変数で説明する予測式を作る「モデリング」と、予測式を元に売上等の効果を最大化または同一の効果数で予算を最小化するといった「予算配分最適化シミュレー ション」がセットになります(図1-3-2)。
![画像19](https://assets.st-note.com/production/uploads/images/9053046/picture_pc_f7e5d13dd7021aa3abbca9b67b24e337.jpg?width=1200)
![画像20](https://assets.st-note.com/production/uploads/images/9053053/picture_pc_6c3877be64755ac6b8c2479ab44b9ab9.jpg?width=1200)
モデル化の方法(統計解析アルゴリズム)については、ひとつ決まったものがあるわけではなく、いくつかの方法が用いられています。本書で紹介するのは回帰分析を用いた方法です。 回帰分析を簡単に説明すると、説明変数Xによって、目的変数Yの変動をどれくらい説明できるのかを分析する手法です。説明変数が複数になる場合は重回帰分析、説明変数がひとつの場合は単回帰分析となります。図1-3-3の表は、TVCMの出稿量と売上金額の関係を示したものです(架空の事例です)。
![画像21](https://assets.st-note.com/production/uploads/images/9053054/picture_pc_5be45414aba981917383e288be953cd3.jpg)
目的変数Yを売上として、説明変数XをTVCMの出稿量としてそれをY=aX+bで説明するためのaとbの値を求めます。aが説明変数の係数(正確には「回帰係数」)bを切片と言います※。 このデータを回帰分析するとY=103746X+59465564(※小数点以下は切り捨て)となり、aとbが求められます(図1-3-4)。aはこのグラフの右斜め上に伸びる直線(これを回帰直線)の傾きを示し、bは緑色の線の部分となります。
![画像22](https://assets.st-note.com/production/uploads/images/9053058/picture_pc_9e4965acce0461a978c0e1495b75e863.jpg?width=1200)
![画像23](https://assets.st-note.com/production/uploads/images/9053068/picture_pc_ebd59bea5716ffdda4a9060060e35887.jpg?width=1200)
aとbを求める際には図中に赤い矢印で示した予測値と実績値の差(これを「残差」といいます) を最小化することを目的にした計算を行い、TVCMの出稿量Xによって売上Yを予測できる状態を作ります。残差は非負数(プラスの値)と負数(マイナスの値)があるため、残差の二乗(残差 平方)を算出し、全てを非負数にしてその値を合計した「残差平方和」を「最小化」する計算を行うのが回帰分析です(図1-3-5)。
![画像24](https://assets.st-note.com/production/uploads/images/9053071/picture_pc_8ad1bf161ac93549983184bc9f4c7b3b.jpg?width=1200)
回帰分析を用いたMMMでは、TVCMだけでなく、新聞広告やデジタル広告など、複数の説明変数を用いた重回帰分析によって売上個数を説明する方程式を作り、導いた偏回帰係数によって、 それぞれの施策の一定単位を増やすと売上等にどれだけ影響するか(介入効果)を推定し、定量化します(図1-3-6)。
![画像25](https://assets.st-note.com/production/uploads/images/9053072/picture_pc_ae7dd30c22aa074c061cb86ed3d5d8e7.jpg?width=1200)
例えば、実店舗での売上が主となっている企業が、FacebookなどのSNSのファンページや運用型広告を活用する例を考えます。一般的には実店舗への影響数が分からないために、Webマーケティング指標となるリーチ人数やインプレッション数などをKPI として用いている場合が多いと思います。
しかし、MMM によって介入効果を定量化することができれば、投稿リーチ1 人あたり、またはインプレッション1 回あたりで店舗売上が〇個または〇円増えるといった新たな指標を得ることができます。これは、TVCMなどのマス広告やLINEや動画広告などの他の施策についても同様です。各施策の投下コストや視聴率、メッセージ開封数や再生数などの1単位あたりでどれだけ店舗売上が増えるという新たな指標を得ることができます。今まで用いていたリーチやインプレッションといった指標がより有益なものに変わるはずです。MMMを活用することで、実店舗などのオフラインの顧客接点が主要なチャネルとなっている企業は、Online(施策)to Offline(売上)やOffline(施策)to Offline(売上)で効果を定量化して把握し最適化できます。オンラインが主要なチャネルとなっている企業では、TVCMなどのオフライン媒体に投資をしている際にOffline(施策)to Online(売上)の効果を定量化できます。昨今マーケターの間で「デジタルシフト」が騒がれていますが、日本はいまだ実店舗などのオフラインチャネルでの取引が主たるもの(9割以上)となっています※。多くの企業がWebマーケティング指標と向き合いOnline(施策) to Online(売上)のデータ分析や最適化に多くのリソースを割いている反面、クロスチャネルでの効果把握など、全体最適のための分析アプローチができている企業はまだまだ少数派です。多くの企業がWebマーケティングの部分最適に対してリソース過多となっているため、全体最適に目を向けるための手法としてMMM を活用していただければと思います。
![画像26](https://assets.st-note.com/production/uploads/images/9053093/picture_pc_4c3683da8bde177a03a25156c1530c35.jpg?width=1200)
![画像27](https://assets.st-note.com/production/uploads/images/9053120/picture_pc_1dc70bac21dc63d02b8321b04f099623.jpg?width=1200)
時系列データ解析で自社の商品やサービスの売上を説明するモデルを作る際、その要因となるプロモーション施策(TVCMなど)の変数を作る際にはTVCMの視聴率や各媒体の推定接触人数など、各施策の影響を象徴するデータを取得する必要があります。それらの多くはシンジケートデータとなります。MMMにおいてシンジケートデータの活用は必須と言えます。また競合企業のKGIまたはKPIとなるデータも取得できれば、それを用いて競合もMMMで分析し自社と効果を比較することができます※。 本節で紹介した内容を整理したものが図1-3-7です。
![画像28](https://assets.st-note.com/production/uploads/images/9053123/picture_pc_2291c804733d6328dc82932b1ac7ba8c.jpg?width=1200)
![画像29](https://assets.st-note.com/production/uploads/images/9053141/picture_pc_1b30870b88e824a44b6c31b4abab5929.jpg?width=1200)
Column シングルソースパネル
シングルソースパネルはインテージ社の登録商標となっていますが、広告マーケティング業界の一般的な用語としても用いられています。同社のホームページでは「同じ対象者(シングルソース)から、購買行動や意識、メディア接触など複数データを継続的に収集する調査パネル。」と説明しています。 こうしたデータを活用することで、TVCMなどのマーケティング施策を実行した際に「購買やブランド価値向上への広告効果」や「購買に至るまでの導線」などを詳細に把握することができます(図1-C-3)。
![画像30](https://assets.st-note.com/production/uploads/images/9053188/picture_pc_d0097dca715a7625a52267f8ccdee29f.jpg?width=1200)
このコラムではインテージ社独自のシングルソースパネルである「i-SSP(インテージシングルソースパネル)」を例に、活用例を紹介します。 皆さんが1週間で見たTV番組パソコンやスマホで閲覧したサイトや検索キーワードの内容を、記憶する限りで回答を求められたら、どれくらい答えられるでしょうか?
i-SSPではそうしたメディア接触や行動履歴(PC・モバイル・TV)をログデータとして機械式で収集し、常時捕捉しています。 全国15歳~79歳の男女52,500人の消費者から継続的に収集している購買データとなるSCI(消費者パネル調査)と紐づけて分析をすることが可能です(図1-C-4)
![画像31](https://assets.st-note.com/production/uploads/images/9053201/picture_pc_22d99b5496199134394f061f34d87621.jpg?width=1200)
i-SSPの活用用途は、主にターゲットプロファイリングと効果検証です。 ターゲットプロファイリングでは、モニターの基本属性として得られているデモグラフィック属性(性年齢や居住エリアや職業等)とアンケートによって得られたサイコグラフィック属性(価値観意識等)や購買履歴を元にして、様々な軸で分析ができます。例えば自社ブランド商品の購買者や、競合ブランドの購買者など特定の興味あるターゲットを抽出して、分単位で処理したメディア接触行動履歴データを分析すれば、抽出したターゲットがどんなコンテンツを視聴する傾向があるか?どんな生活パターンなのか? 等を詳細にプロファイリングできます。追加で自社オリジナルの質問を行うことも可能です。その回答によって更にセグメントしたターゲットごとにプロファイリングすることもできます。 効果検証では、TVCMやWeb広告それぞれの接触または非接触をアンケートで聞いたものではなく、分単位のメディア接触ログを活用できることが強みです。全ターゲットのうち、TVCMのみの接触者やWebのみの接触者や重複接触者を把握し、ベン図で把握する(図1-C5)、日別でそれぞれの累計リーチを把握する(図1-C6)、TVCMとWeb広告の接触回数の分布を確認する(図 1-C-7)など様々な軸で分析ができます。
![画像32](https://assets.st-note.com/production/uploads/images/9053206/picture_pc_9193303cb8034a132874f943f0a88cd0.jpg?width=1200)
![画像33](https://assets.st-note.com/production/uploads/images/9053237/picture_pc_513f58977d787a33cebee026b7c4f16c.jpg?width=1200)
TVCM何回以上かつWeb広告何回以上といった細かな接触パターンによってターゲットセグメントを抽出し、自社ブランドや他社ブランドの購買状況を観察したり、追加で自社ブランドに対する調査を実施することで、広告接触パターンごとの態度変容の変化を分析することもできます(図1-C-8)。
![画像34](https://assets.st-note.com/production/uploads/images/9053248/picture_pc_ab415575a040879e4c8a7ab167ac8567.jpg?width=1200)
これらは活用例のほんの一部です。どのようにデータを活かしていくか?活用方法は様々なものが考えられます。蓄積された膨大なデータを様々な軸で分析し、可視化するための独自システムもあります。昨今では同社が保有する購買データやメディア接触ログなどの時系列データを活用してMMM分析を同社の受託サービスとして提供する、また、第8章P288のコラムで紹介する時系列データ解析ツール「XICA magellan」とのデータ連携などのサービスも提供されています。
【参照URL】
マーケティング用語集「シングルソースパネル」(https://www.intage.co.jp/glossary/526/)
i-SSP(インテージシングルソースパネル)紹介ページ(https://www.intage.co.jp/service/platform/issp/)
SC(I 全国消費者パネル調査)紹介ページ(https://www.intage.co.jp/service/platform/sci/)
Column エージェントシミュレーションによるMMM
本書で紹介する時系列データ解析によるアプローチ以外に、エージェントシミュレーションという手法をMMM分析に活用するアプローチがあります。
エージェントシミュレーションとは、一定のルールに従い自律的に行動するエージェントの振る舞いをシミュレートすることで、エージェント同士の相互作用から現われる、複雑な社会現象を予測し分析する手法です。日本でNTTデータ数理システム社が独自に開発した「S4 Simulation System」を「広告伝播効果シミュレーション」として活用された事例を紹介します。
この例は、新製品の発表によって、消費者がマスメディアからそれを認知したり、製品情報を新しく検索したり、ソーシャルメディア上でのつながりを通じて友人知人にそれが伝わることで情報が拡散していくさまをシミュレーションによって推定することで、広告キャンペーンの効果予測を行った事例です。ソーシャルメディア上のネットワークにより、実際の広告よりも多くの情報が伝播していく過程で新製品に対する認知度がある閾値を超えると商品を買っても良いと考えるようになるなど、「S4 Simulation System」のシミュレーションでは消費者のSNSでのつながりや実社会でのつながりをコンピュータ上の仮想世界のネットワークで再現します(図1-C-9)。
![画像35](https://assets.st-note.com/production/uploads/images/9053551/picture_pc_599079769a7ec073b78fada0cfdea260.jpg?width=1200)
再現されたネットワーク上には新製品を認知者と非認知者がいて、広告を見た誰かがTwitterでつぶやくとそのつぶやきを見た人も新商品を認知する、または、口コミサイトに投稿がなされると、そのページを見る不特定多数のユーザーにも新商品の情報が伝わる、といったように認知者が時間経過とともにどのように広がっていくかをシミュレーションし、認知者の総数の推移を予測します。予測の際には、年齢や性別、職業といったデモグラフィック属性やSNSで得た情報をよくリツイートする人やしない人、フォロー数が多い人や少ない人、Facebookで「いいね」をよくする人がいることなどを反映します。例えば職場や学校、友人関係といった実社会や、FacebookやTwitterといったSNSで人とのつながりが多い人ほど製品の購入確率が高いなどのデータがあれば、それをモデルに適用していきます。図では、赤いジャケットの人が製品を買った人で青いジャケットの人が製品を買っていない人です。赤いバーが製品の購入確率で、例えば、真ん中の人は他の二人より、つながりが多いので購入確率は高くなっていますが、時間が経過すると、購入確率が高い真ん中の人が製品を購入し左側の状態から右側の状態に変わっています(図1-C-10)。
![画像36](https://assets.st-note.com/production/uploads/images/9053560/picture_pc_3352c81fbf9254469c6e43bb831d77e0.jpg?width=1200)
他にも、時間帯によってデジタル広告の接触率の違いや、フォロワーが多い方のツイートを見ると認知者が急増するなど、様々な要因が複雑に絡み合う現実世界に近い振る舞いを再現していきます。そうしたアプローチはエージェントシミュレーションならではといえます。シミュレーションの前提となる消費者の様々な特性や行動パターンの情報を得るためにもi-SSPなどの消費者パネルデータやアンケートから得た情報が必要です。そうしたデータから精度の高いシミュレーションを構築できるかが重要です。「広告伝播効果シミュレーション」では、仮想世界の振る舞いを反映した上でインターネットサイトに広告配信した場合のネットワーク上の情報の広がりをシミュレーションし、20時台、21時合、22時、それぞれの認知者数の数を予測しどの時間帯の広告配信が最も効果があるかといった打ち手を考えます(図1-C-11)。
![画像37](https://assets.st-note.com/production/uploads/images/9053578/picture_pc_eba70d8cc2fc62adaeb73c3310e5648f.jpg?width=1200)
ここ数年で少しずつ、時系列データ解析によるMMM分析が日本でも浸透しつつあります。ただ、日本ではエージェントシミュレーションを用いたマーケティング効果検証の事例は非常に少なく、認知度も低いと思います。「MMM=時系列データ解析」として説明されている場面もありますが、欧米ではエージェントシミュレーションを用いたMMM分析のソフトウェアが提供されていることから、その手法の活用が(日本よりも)積極的だと思います。本書では、「MMM=時系列データ解析」とはせず、本手法の例も掲載しました。時系列データ解析によるアプローチとともに、日本でもMMMの導入と成功事例が増えればと思います。
【参照URL】
S4 Simulation System紹介ページ(https://www.msi.co.jp/s4/)
![画像38](https://assets.st-note.com/production/uploads/images/9053586/picture_pc_54d50f6c61add56e9773fa6938f460d4.jpg?width=1200)
この節では「データマイニング」の分類やデータセットの種類についての基礎知識を紹介しておきます。
![画像39](https://assets.st-note.com/production/uploads/images/9053601/picture_pc_e7c337289016938b423605dd8bc4e30a.jpg?width=1200)
データマイニングは広範な概念であり、使われる場面に応じて多様な意味で用いられています。
が、主に用いられるのはその言葉が示す通り「データから有益な情報を採掘(マイニング)すること」です。データマイニングを「統計解析」と「機械学習」と、目的変数の有無で4タイプに分類し、うちエクセル統計で分析可能な分析を赤字で記載、さらに本書演習で行う分析を(太字+ 下線)で記載しました(図1-4-1)。
![画像40](https://assets.st-note.com/production/uploads/images/9053613/picture_pc_3b969099e5d9a9b189293eb5aa61db6a.jpg?width=1200)
目的変数がある分析とは、「気温が上がる(原因)」と「海水浴客が増える(結果)」など、原因に対応する変数と結果に対応する変数がある分析です。予測または原因となっている変数の一定数を増やすと結果となっている変数が一定数増加する介入効果の推定が主な目的となります。対して目的変数がない分析では、クラスター分析のように分析対象となる標本を分類する、変数の関係を明確化することが主な目的となります。
【参照URL】統計WEB 統計学の時間「説明変数と目的変数」(https://bellcurve.jp/statistics/course/1590.html)
「統計解析」と比較し「機械学習」は新しいジャンルです。機械学習とは「明示的にプログラミングすることなく,コンピューターに学ぶ能力を与えようとする研究分野(A.L.Samuel[1959])」です。マーケティングのデータマイニングで用いられる機械学習は、主に人間では対応できない膨大・複雑なデータから知識の候補や仮説の導出をすることに期待されています。次に、データマイニングにおける「統計解析(ここでは主に多変量解析)」と「機械学習」それぞれの分類について説明します。
![画像41](https://assets.st-note.com/production/uploads/images/9053622/picture_pc_b75a68a71bab8747d397109889061fcc.jpg?width=1200)
多変量解析とは、多数のデータ(変数)間の相互の関係性をとらえるために使われる統計的手法の総称です。主に因果推論または予測に用いられる「目的変数有り」の分析手法と、主にデータの分類・要約に用いられる「目的変数なし」の分析手法に分かれます(図1-4-2)
![画像42](https://assets.st-note.com/production/uploads/images/9053633/picture_pc_52f008f427c47219ff03f90cba881f5e.jpg?width=1200)
更に、扱うデータ(変数)には質的変数と量的変数の区別があり、どちらを扱うかによって分析の手法が変わります。質的変数とは、データがカテゴリーで示されるものです。名前の通り、データ間の「質」が違う変数です。例としては、性別や血液型などです。さらに質的変数はデータを評価する基準(これを尺度と呼ぶ)によって名義尺度と順序尺度に分類されます。対して量的変数は名前の通り、データの「量(数値)」が基準となるものです。例としては、気温や速度などがこれに相応し、さらに間隔尺度と比例尺度に分類されます(図1-4-3)。
![画像43](https://assets.st-note.com/production/uploads/images/9053650/picture_pc_659c4eaef0a6a9d0b5af9ac1952d99d4.jpg?width=1200)
見分けづらいのは「 間隔尺度」と「 比例尺度」です。「この2つの尺度を見分けるコツは、「0 の値に意味があるかどうか」を考えることです。温度や西暦は「0」だったとしても、その温度や西暦が「無い」わけではありません。一方で、身長や速度が「0」であるときは、本当に「無い」ときです。」(統計WEB「変数の尺度」より引用)比例尺度における「0」は絶対的な意味を持ち、間隔尺度における「0」は相対的な意味となります。
扱うデータ(変数)が質的データか量的データかという区別と目的変数の有無を掛け合わせて多変量解析の手法を分類した表が図1-4-4 です。
![画像44](https://assets.st-note.com/production/uploads/images/9053663/picture_pc_f1d2a549f76031f2c3456e602fa1c7b0.jpg?width=1200)
【参照URL】統計WEB 「変数の尺度」(https://bellcurve.jp/statistics/course/1562.html)
![画像45](https://assets.st-note.com/production/uploads/images/9053713/picture_pc_eeb600bbddb6c2b1830d0adc2117ba62.jpg?width=1200)
機械学習は主に「教師あり学習」「教師なし学習」「強化学習」の3つに分類されます。「教師あり」と「教師なし」は多変量解析の目的変数の有無と対応しています。「教師あり学習」は、入力に対してあらかじめ正解がわかっている場合に、正解を導くパターンやルールを学習する手法です。ここでいう「教師」というのは、正解データのことです。顧客の購買ログなどのデータセットを樹木上のモデルを使って分類することで、「教師なし学習」は、正解のないデータから類似グループをまとめたり、重要な特徴を重要な特徴を抽出したりする学習方法です。「強化学習」は、コンピューターが自ら試行錯誤しながら最適な戦略を学習する手法です。」(韮原,2018)
【参照文献】韮原祐介(著)『いちばんやさしい機械学習プロジェクトの教本』インプレス社、2018年
「教師あり学習」は特定の商品の購買など、なんらかの結果に与えた要因を把握または分類する「決定木」分析や、予測に必要な一部のデータのみを用いて回帰や分類を行う「サポートベクトルマシン」などがあります。「教師なし学習」はクラスタリングや、A商品を購入している人はB商品も買う定木」分析や、予測に必要な一部のデータのみを用いて回帰や分類を行う「サポートベクトルマシン」などがあります。「教師なし学習」はクラスタリングや、商品を購入している人はB商品も買う傾向があるといった関連(英語でassociation)を分析するアソシエーション分析などがあります。「強化学習」はMMMにも応用されるエージェントベースシミュレーションなどがあります。
![画像46](https://assets.st-note.com/production/uploads/images/9053722/picture_pc_ff2279e1c620d77e945e048655871e9e.jpg?width=1200)
時間を一時点に固定して止め、その時点で区切ってデータを記録したものを 横断面データ(cross section data) といいます。これに対し「一つの項目について」時間に従って取ったデータを時系列データ( time series data) といいます。それを一定の間隔で取得して時系列データ的な側面もあるデータをパネル・データ( panel data) といいます(図1-4-5)。
![画像47](https://assets.st-note.com/production/uploads/images/9053742/picture_pc_7032095e6ec6ee6355f71182fe343077.jpg?width=1200)
生まれた年ごとに記録し、経過時間に沿って集計したデータをコーホートデータ(cohortdata) といいます(図1-4-6)。主に、同じ時期に生まれた人の生活様式や、行動、意識などからくる消費動向を分析する際に用いられるものです(その分析を「 コーホート分析」と言います)
![画像48](https://assets.st-note.com/production/uploads/images/9053746/picture_pc_ddeee4bc1b5a0190d65fe775c58313b9.jpg?width=1200)
![画像49](https://assets.st-note.com/production/uploads/images/9053797/picture_pc_b89856ef54c596de8f1a5b87dceed0b3.jpg?width=1200)
以上が、「データセットの種類」です。マーケティングの現場ではリサーチの対象者のことを「パネル」と言うため、モニターの回答データのことを示す用語として「パネル・データ」という言葉が使われる場合がありますが、本来の「パネル・データ」の意味はここで紹介したものです。MMMの分析で用いるデータは、複数項目の時系列データなので「データセットの種類」の本来の意味からはパネル・データとなりますが、統計解析ソフトウェアなどでは時系列データとして扱うことが多くなります。統計解析において重要なのは分析の際に「 データの順番に意味があるかないか」です。統計解析ソフトなどでデータを扱う場合は、順番に意味があれば「time series
data」として扱い、そうでない場合は「cross section data」として扱われます。time series data(時系列データ)として扱う場合は、分析時に特殊な作法が必要になる場合があることを覚えておいてください。
![画像50](https://assets.st-note.com/production/uploads/images/9053815/picture_pc_04757c905bbbd62ff3fea935d3ecc09e.jpg?width=1200)
![画像51](https://assets.st-note.com/production/uploads/images/9053862/picture_pc_e667a8fa56004b8f9d4e6a1e2f1bbb4b.jpg?width=1200)
![画像52](https://assets.st-note.com/production/uploads/images/9053762/picture_pc_df7de21d725568b9369d876b36d0cfbf.jpg?width=1200)
第1章の最後に、本書の演習内容と構成をまとめておきます。
![画像53](https://assets.st-note.com/production/uploads/images/9053882/picture_pc_dfe6f3b9f950a156897d5070b534f79b.jpg?width=1200)
第2章では、筆者が筆者が所属するカーツメディアワークスのように企業のマーケティングを支援する会社のホームページに来る問い合わせをイメージした架空のデータをcross section data として扱います。どういった属性の顧客が契約に至りやすいか?クロス集計と数量化2類による分析を体験していきます(数量化2類の分析実行時にクロス集計が行われるのでその内容も参照)。そこで見出した傾向がただのバラつきや誤差で生じたものではないか?を確認するための独立性の検定も体験します。クラスター分析の演習では探索的に顧客の傾向を把握していきます。
![画像54](https://assets.st-note.com/production/uploads/images/9053892/picture_pc_1d8bf6afe25ef42b318c6823445b3548.jpg?width=1200)
![画像55](https://assets.st-note.com/production/uploads/images/9053915/picture_pc_c4ded52f5669462d7b480dcdfef30cc1.jpg?width=1200)
![画像56](https://assets.st-note.com/production/uploads/images/9053924/picture_pc_d7116e7239eaa9a7960bac6603d03c1f.jpg?width=1200)
第3章〜第4章では、(架空の)アルコール飲料の売上数や広告出稿量などのマーケティング施策の量的データを主に用いて、それをtime series data として扱うMMM 分析の準備を行います。分析に用いるデータの分布などの状態を把握していく手順を理解します。第3章では、Excel の「分析ツール」を使ってデータの確認を行うための折れ線グラフやヒストグラムの量的データを主に用いて、それをtime series data として扱うMMM 分析の準備を行います。分析に用いるデータの分布などの状態を把握していく手順を理解します。第3章では、Excelの分析ツール」を使ってデータの確認を行うための折れ線グラフやヒストグラムの作り方や基本統計量の見方を知る演習と相関係数を把握する演習を行います。複数の変数の影響を考慮する偏相関係数と季節性を月別の指数として把握する期別平均法をエクセル統計で体験します。
![画像57](https://assets.st-note.com/production/uploads/images/9053935/picture_pc_69d6d8bfa6c03a82b5b455a2cc50f987.jpg?width=1200)
![画像58](https://assets.st-note.com/production/uploads/images/9053946/picture_pc_420240b619821665ef18674759322502.jpg?width=1200)
回帰分析はどのようにして行っていくのか?Excelの分析ツールを用いた演習で基本的な操作方法と、推定結果で出力される決定係数やP値などの指標の内容を把握します。月次の季節性を考慮するための「ダミー変数」の作り方についても演習します。Excel 単体の機能で行う方法とエクセル統計のユーティリティ機能の体験の双方を行います。
![画像59](https://assets.st-note.com/production/uploads/images/9053959/picture_pc_df8e19727447c4fcf41b501d8d7ed9df.jpg?width=1200)
![画像60](https://assets.st-note.com/production/uploads/images/9053969/picture_pc_afd304d306f19bc617141812c694ab28.jpg?width=1200)
【MMM_modeling】Book を使用し、マクロを用いて回帰分析の実行作業を効率化し、ソルバーを用いて、残存効果やマーケティング施策の投下量に応じて効果の増分が逓減する非線形な影響を考慮することで、予測精度の高いモデルを探索する手順を演習します。さらにモデル探索の効率を上げる「エクセル統計」の重回帰分析の「説明変数選択機能」も体験します。その後で残存効果や非線形な影響を加味する計算とはどのようなものか? (Excel 標準の)ソルバーとはどんなものか?追加の演習で理解していきます。
![画像61](https://assets.st-note.com/production/uploads/images/9053979/picture_pc_d8a85e82c8a26a0acdf185e5d87106b4.jpg?width=1200)
![画像62](https://assets.st-note.com/production/uploads/images/9053987/picture_pc_003b4f603a03cae96d740b4a2a702540.jpg?width=1200)
第5章の演習で作った予測モデルによって得た値を【MMM_modeling】Book で集計し、それを試算用に使用する【MMM_simulation】Book に転記します。各週の投下予算をX軸に、目的変数への影響数をY軸にプロットするグラフで、各マーケティング施策の効果予測をプロットして横並びで把握し、ソルバーを使って売上数を最大化するための予算配分のシミュレーションを行う演習を行います。Webプロモーションについては各週の投下量を増やすと、単価が上がる傾向といった前提を試算時に加味して補正する方法を演習します。第3章で簡易的に行っていたデータ分布の確認から踏み込んで「外れ値」をエクセル統計の「箱ひげ図」によって作成する体験をして、
外れ値が分析結果にもたらすバイアスとはどういったものか?演習で体験します。ある施策の過去実施投下量を大きく上回る変更をした際に、(過去データを元にした)分析結果の効果予測通りになるか?といった留意事項に対しても共有します。
![画像63](https://assets.st-note.com/production/uploads/images/9053993/picture_pc_7a5e65a33ea12ea09fddc45516102852.jpg?width=1200)
![画像64](https://assets.st-note.com/production/uploads/images/9053998/picture_pc_9407513d13a14c473e776a6c2586d3de.jpg?width=1200)
(架空の)通販企業の例を用いた演習です。ダイレクトレスポンス型広告の既存の方法(オンライン、オフラインそれぞれの媒体の獲得単価による最適化)を紹介した上で、クロスチャネルの効果把握を行う視点について解説します。オフライン(コールセンター)とオンライン(EC)の双方への申込数を予測するモデルを作り、2つのモデルから効果数または利益を最大化するためのマーケティング施策予算配分のシミュレーションの演習を行います。
![画像65](https://assets.st-note.com/production/uploads/images/9054004/picture_pc_0bc7f540218d5c08705e090e1325d849.jpg?width=1200)
![画像66](https://assets.st-note.com/production/uploads/images/9054014/picture_pc_65b9561740b058c414da8ba2d13ee016.jpg?width=1200)
この章では演習によってデータ分析手段を理解した上で、MMMで必要なモデル選択視点を確認します。「まずはやってみる」方針をとったため、第3章~第7章までの演習で省略した解説のうち、主にMMMの説明変数選択やモデル選択視点のために必要な考察を行うための統計的因果推論の知識について簡単に解説します。分析の軸足をマーケティング施策の介入効果の推定(説明)に置くか?あるいは売上などのマーケティング目的となる変数の未来予測(予測)に置くか?によって変わる説明変数選択の選定と候補変数を洗い出す視点を共有した上で、最後に、本書で紹介してきた推定結果にバイアスをかけてしまう、または信頼できなくなる落とし穴となる事項について一覧でおさらいします。
![画像67](https://assets.st-note.com/production/uploads/images/9054031/picture_pc_06afc0976bf37117f93de4f68bb8576f.jpg?width=1200)
![画像68](https://assets.st-note.com/production/uploads/images/9054038/picture_pc_e4b3906c26b6b60f974d02bba39d2858.jpg?width=1200)
3つの演習を行います。 ひとつ目は、紙媒体などの説明変数の外れ値による推定結果のバイアスを考慮する分析です。「ロバスト(頑健)」な回帰分析となるMM推定を、統計ソフト「R」の「robustbase」というパッケージによって行い、得られた推定結果を本書付録のエクセルSheetに記載する方法を紹介します。 5-12「「MMM_modeling」BookでGRG非線形とエボリューショナリーの違いを体験」の節ではエボリューショナリーを用いて推定をした際にLINEST関数による計算を実行せず、ソルバーによって導いた推定結果に対応する決定係数やP値などの指標を算出します。その算出に用いたSheetを用います。 ふたつ目はExcel2016に加わった時系列データの「予測ツール」を用いて「コート」の検索数を予測する方法です。
![画像69](https://assets.st-note.com/production/uploads/images/9054066/picture_pc_bb1b7691bbc4c6efc224a5647d2fc87f.jpg?width=1200)
3つ目は、回帰分析を時系列データに適用する際に起こり得る「見せかけの回帰」という症状を避けるための方法のひとつとなる「単位根検定」という検定です。
![画像70](https://assets.st-note.com/production/uploads/images/9054077/picture_pc_14cf71f7ff2b251392118a61884bcf84.jpg?width=1200)
注意事項
(1) 演習内で紹介しているExcel操作において、列や行の幅やグラフの大きさやナビゲーションウィンドウの位置を適宜微調整している場合があります。
(2) 本書で提供する演習用データセットは全て架空のものとなります。筆者が独自に乱数計算などを用いて製作したもので、実在する企業や団体のものではありません。
(3) 本書ではWindows版のExcel2016をもとに解説しています。それ以前のバージョンと操作法が異なることがありますので、その場合はExcelのヘルプなどを参照してください。Mac版での操作に関しても同様の対応をお願いします。演習で用いるソルバーはExcel2010以降のバージョンの機能を前提としています。以下に記載する検証環境でテストを行っています。固有のExcel設定やハードスペック、またはデータの内容により予期せぬ事項が発生する可能性があり、動作保証は致しかねます。あらかじめご了承ください。
【検証環境】
OS:Windows10 Home/Excel 2016(Office365)/プロセッサ IntelⓇ CoreTM i7-8550U
CPU @1.80GHz 1.99GHz/RAM 16GB/64ビット オペレーティングシステム、x64 ベースプロセッサ
(4) 本書の演習で使用するエクセル統計(体験版)は、Microsoft Excel上で動作する統計解析ソフトです。
Windows10/8.1/8/7で動作するExcel2016/2013/2010に対応しています。macOSには対応していません。
※製品版も同様です。
(5) エクセル統計の体験版を用いた演習では、「(エクセル統計)」という記述がSheet名に含まれるSheetを用いて行います。エクセル統計体験版でデータ分析ができるように処理をしているため、シート上では数値や書式など一切の編集ができません。
(6) 本書のMMM分析でExcelソルバーに解かせている問題は、問題の特性及びExcelソルバーの機能的な制約から、唯一の最適解を保障できるものではありません。
(7) 付録のExcelファイルを用いたMMM分析による意思決定は自己責任のもと行ってください。筆者および出版社、エクセル統計のSSRI社では、意思決定に関する責任は一切負えません。
(8)出版社及びSSRI社では書籍内容についてのサポート(ご質問への回答)を一切行いません。
(9) 筆者が所属するカーツメディアワークスでは、本書内容を補足する研修サービス(主に企業マーケター向けのものです)を提供する予定です。
【ご相談窓口】
bookinfo@kartz.co.jp
※原則、研修サービスの問合せ窓口となります。ご質問内容によっては対応できないケースがあります。
Column エクセル統計と統計WEB
エクセル統計はExcelのメニューに統計解析の手法を追加する統計解析ソフトです。スクリプトやコードの入力は不要で直感的に使用できます。機能ごとにモジュールを選択または買い足す必要のないオールインワン型のパッケージソフトです。契約期間を1年から6年まで選択することができ、価格帯も比較的安価にもかかわらず、基本から応用までよく用いられる統計解析手法を130以上搭載しています。日本社製品では国内で最も売れている統計解析ソフトです。
![画像71](https://assets.st-note.com/production/uploads/images/9054089/picture_pc_92bb1a30e0faa0f2d9e67d7d949cf54e.jpg?width=1200)
医学分野をはじめ、理工学、農学、教育学など研究分野で主に利用されており、エクセル統計を統計解析に利用した論文がNature、Scienseなど多数掲載されています。研究者には浸透していると思いますが、マーケターにはあまり知られていないかもしれません。マーケティング分野ではよく名前を聞く統計解析ソフトウェアに「R」や「SPSS」などがあります。「R」はグラフィックインターフェイスがなく全ての操作をコードで行うハードルがあります。「SPSS」はオールインワンパッケージではないため、分析目的やテーマ-を明確にして活用しないと高価になる場合があります。エクセル統計を提供する(株)社会情報サービスの協力を得て、Excel上のデータをそのまま「エクセル統計体験版」で統計解析できる演習を実現しました。本書の演習では時系列データ解析を用いて行うMMMで使用する「重回帰分析」や顧客調査や分析に使用する「数量化2類」や「クラスター分析」など、エクセル統計の機能の一部を使用しますが、本書の演習をきっかけに統計解析の楽しさを知ってもらった上でエクセル統計を使うことで(本書で紹介しきれなかった)他の統計解析手法をマーケティングに活用する可能性が拡がると思います。
「統計WEB」は(株)社会情報サービスが2000年から提供している統計学の情報サイトです。より多くのマーケターに統計の楽しさを知って頂くため、本書では数式による説明を極力省き、専門的な知識を補完頂くための参考文献の主なものとして「統計WEB」のコンテンツを活用させて頂きました。
![画像72](https://assets.st-note.com/production/uploads/images/9054104/picture_pc_319f9a54cc521adb47806b5e25f08fd3.jpg?width=1200)
以上が(1章までの)全文公開となります。
本書のColumnでは、1章までに紹介した「True Lift Model™(トゥルー・リフト・モデル)」(電通デジタル社)、「i-SSP(インテージシングルソースパネル)」(インテージ社)、「S4 Simulation System」(NTTデータ数理システム社)、「エクセル統計」(社会情報サービス社)といったツールに加え、2章以降では、西内啓氏のノウハウが詰まった拡張アナリティクスツール「dataDiver」(データビークル社)、クロスセクションデータを用いたマーケティング施策価値算出ツール 「Third Man」(コレクシア社)、汎用数理計画法パッケージ「Numerical Optimizer」 (NTTデータ数理システム社)、重回帰分析を利用したパス解析モデリングの分析ツール「XICA magellan」(サイカ社)、事象間の因果関係のモデル化から確率的シミュレーションを行うベイジアンネットワーク 分析ソフトウェア「BayoLink」(NTTデータ数理システム社)、ソーシャルリスニングツール 「Crimson Hexagon ForSight™ Platform(クリムゾンヘキサゴン)」(ブレインパッド社)、リサーチ対象国 58カ国に及ぶアクセス解析ツール「SimilarWeb PRO」(ギャプライズ社&SimilarWeb Japan社)、ID-POSデータツール「Dolphin Eye(ドルフィンアイ)」(True Data社) といった手法を紹介しています。
昨今のデジタルマーケティングにおいては「データを集めて活用しましょう」といった風潮がありますが、どの様なデータをどの様に解析すればどういった示唆が得られる、そうした知識に基づいて選択されるリサーチデザインによって集めるべきデータもモデルに採用するデータ(変数)もモデルの選択視点も変わります。マーケティングの現場ではそうした知識がある方は不足しており、モデルを作って説明や予測を行うといったことを実務レベルで理解し活用できているマーケターは希少な方だと思います。本書ではそうしたツールを使いこなすリサーチデザイン力のあるマーケターになる為に知っておいて頂きたい手法として最新のマーケティングサイエンス手法やシンジケートデータをいくつか紹介しました。DMP、MA、BIといったデジタルマーケティング業界で話題のツールや要素技術の紹介はデジタルマーケティング関連ニュースにお任せし、そうしたツールを使いこなすマーケターになる為の知識として、様々な分析の手法を共有することに主眼を置きました。
また、多くの企業ができていないのはクロスチャネルでの施策効果の把握と予算配分の最適化による効果向上です。「Excelでできるデータドリブン・マーケティング」では、具体的な手法のひとつとして、高度な分析サービスとなる時系列データ解析によるマーケティング・ミックス・モデリングを丁寧に解説し、付録の分析ツールを用いてご自分のデータも分析できる環境を提供しました。演習を通じて学ぶことで、インターネット施策が実店舗の売上をどれだけ上げるか?TVCMがネット売上をどれだけ上げるか?クロスチャネルの効果把握が可能になります。
また、自社の顧客価値を正しく定量化して把握出来ている企業もほとんどいないと思われます。なぜなら、自社顧客に対するアンケートに回答する方はロイヤリティが高い方に偏る傾向があり、因果推論の際に用いられる分析を応用し、そうしたバイアスを補正する方法などがありますが、私がご案内する前に、その手法にすでに取り組まれているケースを聞いたことがありません、説明して初めて知るマーケターが殆どです。そうした手法についてページ数の制約もあり、その多くは書籍に盛り込めませんでした。今後、私が「効果検証デザイナー」という存在を目指し、因果推論の文脈に基づいて正しく施策の効果検証(因果効果の推定)をするやり方や顧客アンケートのバイアス補正で顧客価値を正しく定量化して把握する方法などをマーケターに共有していきたいと考えています。
【更新情報2024年5月26日】
「その決定に根拠はありますか?」
確率思考でビジネスの成果を確実化するエビデンス・ベースド・マーケティング
戦略を導く為の「エビデンスの作り方」をテーマに、これまで体系化してきたノウハウを紹介したマーケティング・インテリジェンスの書籍を出版致しました。5問の調査でTVCM(施策)→コンビニで商品を見た(要因)→売上がいくら増えたか?→年間16.67億円(効果)の様に経路ごとに構造的に効果を把握する国際特許(PCT)を出願した分析法など、確率モデルや因果推論をプロジェクトで実際に活用している方法を特典の動画講義も活用して実装レベルの知識まで提供しています。