見出し画像

相関≠因果を注意しろと言われるが、実際どうすれば良いのか?


はじめに

グロービスでデータサイエンティストをしている松浦です!
私は普段、GLOBIS 学び放題についてのデータ分析や調査を行っています。

早速ですが、皆さんは相関関係≠因果関係であることはご存じですよね。
「相関関係と因果関係は異なるので、注意すべき!!」という話は色々なところで見聞きするので、ご存じの方は多いのではないかと思います。
「なんだ、よくあるその話ね」と思われてこのページを離れようとしている方、、、もう少しお付き合いください。

それでは、実際のところ、
相関関係をビジネスに活かす時、どのように注意して対応すべきなのでしょうか
相関関係について「注意しろ!!」とは言うものの、具体的に「何をどうしたら良いか?」を説明したものは、あまり見たことが無いような気がします。

ちなみに、我々、グロービスのデータサイエンスチームではGLOBIS学び放題に関して、学びの意欲や施策の効果等について様々な要因分析を行なっています。
要因分析では、目的変数に対して因果関係のある要因を解き明かすことを目的としていることから、相関関係なのか因果関係なのかの見極めは非常に重要になってきます。
私は前職では機械学習で予測分析を行う仕事をメインで行なっていましたが、予測のためには相関関係が分かれば十分なため、相関と因果の違いを意識する必要も機会もほとんどありませんでした。
一方で、グロービスに入社して要因分析を行う機会が増えて以来、「相関関係をビジネスに活かす時、どのように注意して対応すべきなのか」について、色々と思考してきました。

また、グロービスのデータサイエンスチームでも、相関分析の結果を扱う際には相関と因果の違いについて注意して対応する文化が浸透しており、後述するような因果推論の取り組みを積極的に取り入れるなどしています。
しかしながら、「どのように注意して対応すべきなのか」を具体的に説明して、と言われると暗黙知的な状態ゆえ、私自身、少々難しい気がしますし、ケースバイケースなことも多く、再現性も無いような気がします。
そのため、ビジネスや開発チームと会話する時にこれらのことについて上手に伝えられないこともあり、モヤモヤすることがあります。
そこで、今回の記事では、「相関関係をビジネスに活かす時、どのように注意して対応すべきなのか」について、私なりに具体的かつ汎用化して言語化してみようと思います。

分析を通じて相関関係を明らかにする機会は多いと思いますが、私と同じ様なモヤモヤを抱えているビジネスマン・データサイエンティストの方々にとって、少しでもお役に立てる内容となれば嬉しいなと思います。

そもそも相関・因果関係を分析する目的とは?

まず、皆さんのよくある分析例として、
「〇〇している人は××している傾向がある」的なこと知るために、「〇〇と××の相関係数を出す」ようなことを頻繁に行うと思います。
このような分析は何の目的で実施するのでしょうか?

ビジネスにおいて大事なことの一つはリソース(ヒト・モノ・カネ)の配分ですよね。
ビジネスにおいてリソースが無限であれば、思いつく施策を片っ端から実行すれば良いですが、現実問題はそうもいきません。
そのため、相関関係や因果関係の分析を通じて、目的とする変数(例えば売上)を変化させるためのドライバー要因を見つけることができることに意義があると言えます。
また、ドライバーとなる要因を絞りこむことができれば、無限の施策案の中から、目的とする変数(以下、目的変数)に影響を与えられる可能性が高い施策に絞り込むこともできる訳です。

まとめると、相関・因果関係を分析する目的は以下のように考えられそうです。
目的1:目的変数を変化させるためのドライバー要因の発見
目的2:(目的1を通じて)目的変数に影響を与えられる可能性が高い施策の絞り込み

相関関係をビジネスに応用する時の懸念点・因果関係との違い

※ここは「相関関係と因果関係が異なること」について、十分理解されている方は読み飛ばして頂いても大丈夫です。
目的変数を変化させるためのドライバー要因と断定するためには、相関関係だけでなく、因果関係があることが必要です。
(「断定」という言葉がポイントです)
もう少し具体的に説明します。
まず、相関関係と因果関係については以下のように分類できます。

仮に、Yを改善したい目的変数とした時に、相関分析でXがYと相関していること(=XとYの相関関係)が分かったとします。
この時、上図の①〜④のいずれかに該当する訳ですが、XとYの相関関係が①(X→Yの因果関係)もしくは②(X⇄Y両方向の因果関係)であればXを変化させることでYを変化させることが可能です。
一方、③(Y→Xの因果関係)や④(疑似相関)の場合、Xを変化させてもYを変化させることはできません。

一般的に、要因分析を行おうとした場合、相関係数の算出や統計的検定等が主要な方法かと思います。
しかし、これらの方法から見つけられるのは相関関係です。
そして、上図の①〜④のいずれに該当するかは、このような相関分析の結果だけでは分かりません。

以上を踏まえて、「相関関係と因果関係は異なるので、注意すべき!!」というのは、具体的に言うと、
相関分析である以上、相関関係までしかわからない。一方で、相関関係は①〜④のパターンが考えられ、③④の可能性もあるので注意すべき」ということになります。
ビジネスアクションに引き寄せた別の言い方をすると、
相関関係の場合、仮にXを変化させる施策を行ったとしても、③や④の場合はYに影響を与えられない効果の無い施策になってしまうので注意すべき」とも言えます。

なお、「ドライバーになる(因果関係である)確証がないなら、相関関係なんて分析しても意味ないじゃん!」と思われる方もいらっしゃるかもしれません。
しかし、それも違います。
相関関係を見つけるだけでも、数ある変数の中からドライバー「候補」を絞り込むことができるという意味では有益です。
別の言い方をすると、相関関係が無い変数は因果関係が無いことも明らかですので、ドライバー「候補」から除くことができるため、有益と言えます。

ちなみに、私たちグロービスのデータサイエンスチームではGLOBIS学び放題ユーザーの行動ログを用いた分析をすることが多いのですが、その際、相関分析を通じて相関関係を見つける機会も多いです。
一方で、行動ログデータの特徴として、「とある行動(データ)につられて、別の複数の行動(データ)が連動して変化する」ということが起こりがちです。
そのため、行動ログデータの分析で2変数間の相関関係を見つけたとしても、上図④のような疑似相関である可能性が高い場合も多く、注意して扱うことを意識しています。

では、相関関係を見つけたとして、どのように注意してアクションプランに落とし込むべきなのでしょうかか?
次項から具体的に考察・記載していきたいと思います。
(前置きが長くなりましたが、ここからが本題です)

得られた相関関係をビジネスに応用したい。どうする?

まずは、前提の再確認です。
相関・因果関係を分析することで
目的1:目的変数を変化させるためのドライバー要因の発見
目的2:(目的1を通じて)目的変数に影響を与えられる可能性が高い施策の絞り込み
を行うことが目的でした。
一方で、一般的に行われるのは相関分析です。
そのため、現段階では、数ある変数の中からドライバー「候補」が絞り込めている状態です。
ドライバー「候補」なので、本当はドライバー要因ではない可能性や、仮に施策を実行したとしても効果が得られないというリスク(=前述の③(Y→Xの因果関係)や④(疑似相関)であるリスク)も孕んでいます。
とはいえ、ここで何もせずに「ドライバーになっている確証が無いので、この分析結果は無かったことにしましょう」というのも、何も価値を産まず勿体無いので、「注意しつつもビジネスに活かしていきたい」というのが状況です。

まず、「相関分析の結果をビジネスに活かす」という観点での目的は、以下にように言い換えられそうです。
目的1:目的変数を変化させるためのドライバー要因(KPI)の発見→決定(ドライバー要因候補の「発見」はできたので、次は「断定」して決定したい)
目的2:目的変数に影響を与えられる可能性が高い施策の絞り込み≒(考えられる施策の中から)実際に実行する施策や優先順位を決めたい

そして、これらの目的を達成するためにどのような検討を行うべきかを考えていきたいと思います。
この検討事項については正解があるものではありませんが、私としては、以下のような検討事項が良いのではないかと考えています。


次項より、太字の検討事項の詳細と検討事項の活用について記載していきます。

検討事項1:因果関係と考えられる可能性の推測

具体的には、下図(再掲)の相関関係の①〜④の内訳の内、①や②の因果関係であると考えられる可能性を推測するプロセスです。

推測を行うにあたっては、精緻な分析や調査は行わず、あくまでドメイン(ビジネス上の)知識や想像するユーザー心理に基づいて、仮説ベースのロジックや感覚に基づいて推測して行きます。
「なんだそんなことか」と思われる方も多いかもしれませんが、このプロセスを毎回意識して検討することが、相関関係と正しく付き合う上で最も重要な事項であると私は考えています。

具体的な方法について簡単な例とともに説明してみようと思います。
例えば、あなたは今、銭湯の経営者だとします。
そして今、(ビールの在庫過多等の事情で)銭湯で販売している「ビールの売上」を上げたいと考えています。
そこで、データ分析を行なってみたところ、「風呂の温度」と「アイスクリームの売上」と「ビールの売上」とがそれぞれ相関関係にあることが明らかになったとします。
では、「A:風呂の温度とビールの売上」と「B:アイスクリームの売上とビールの売上」の相関関係は、それぞれ上記の①〜④のいずれに該当すると考えられるでしょうか?
回答は言わずもがなかもしれませんが、
A:風呂の温度とビールの売上は①の因果関係
B:アイスクリームの売上とビールの売上は④(他因子Zとして風呂の温度が存在する)の疑似相関
であると言えそうです。
(厳密には、検証しているわけではないので、「可能性が高い」と推測できると言える。)
そのため、「ビールの売上」を上げるドライバー要因として「風呂の温度」、施策として「風呂の温度を上げること」が考えられます。
一方で、「アイスクリームの売上」はドライバー要因では無いことや、「アイスクリームの売上を上げる様な販促施策」は「ビールの売上」を上げる効果が無いことも予想されます。

このように、目的変数と相関関係にあるドライバー候補変数との関係性が①〜④のいずれに該当しそうか考えてみるプロセスを挟むことによって、ドライバー候補変数(とそれに紐づく施策)をさらに絞り込むことができます。

加えて、このプロセスで意識すると良いこととして、相関分析実施時には未観測であった心理要因やその他の行動要因も想像して考えてみることです。
未観測因子(心理要因や行動情報)により、目的変数とドライバー候補の説明変数間をつなぐ因果関係の仮説を構築できれば、①〜④のいずれであるかが推測しやすくなります。

先ほどの「風呂の温度」と「ビールの売上」の相関関係の例で言えば、
風呂の温度とビールの売上は、未観測因子として「発汗量・喉の渇き」やそれに伴う「冷たい飲み物を飲みたい気持ち」といった要因がZとして介在していることが想像され、下図の様な因果関係の仮説が構築できるので、「風呂の温度」と「ビールの売上」の関係は①の因果関係と予測できる
というような具合です。

また、近しい記載ではありますが、このプロセスで意識すると良いこととして、こちらの記事も参考になるかもしれません。

こちらの記事にも記載がありますが、複雑な関係を頭の中だけで考えていても整理が難しいので、まず因果関係を仮説的に図で視覚化(見える化)することが重要です。
先ほど挙げた銭湯の例は、脳内でイメージするだけでも理解できる非常に簡単な例かと思いますが、実際にビジネスで実践する際には、その他の心理要因や行動要因を想像しながら、手を動かして視覚化してみて、因果関係の仮説を構築していくのが良いと思います。

また、繰り返しですが、この際、精緻な分析や調査は行わず、あくまでドメイン(ビジネス上の)知識や想像するユーザー心理に基づいて、仮説ベースのロジックや感覚に基づいて推測する程度で良いと思います。
一方で、知識や経験に基づいて思考を行うプロセスなので、なるべく多くのメンバーや経験値の高いメンバーを巻き込み検討するのが良いと思います。

なお、考えても①〜④のいずれに該当しそうか分からない場合は潔く諦めて、不明と判断しましょう!!
不明の場合、必要に応じてではあるものの、後述する「追加検討①:調査(定性インタビュー・定量アンケート)」や「追加検討②:因果関係(統計的因果推論)の分析」といったネクストアクションが考えられます。

上記の「風呂の温度・アイスクリームの売上・ビールの売上」のような分かりやすい例は稀かもしれませんが、この検討プロセスを試すことなく、当てずっぽうでドライバー候補変数を選んだり施策を試すよりは、意義があるプロセスだと考えていますので、皆さんも是非意識してみると良いのではないかと考えています。

(補足)因果関係を示すための論理的条件
なお、教科書的には、以下のように言われています

因果関係を示すには「①相関関係だけでなく②時間的順序③他の原因がないこと」の要素が必要

改訂3版 グロービスMBAクリティカル・シンキング (グロービスMBAシリーズ)より

①②については簡単な条件ではありますが、③の条件についての担保が非常に困難であり、人によるロジックで推測・判断するためには、上述した様なプロセスで推測していくことが必要になります。
なお、厳密に因果関係を示す最も有名な手法としてはRCT(ランダム化比較試験、ビジネス現場ではABテスト)が挙げられます。

検討事項2:そもそもその要因が制御可能かの評価

目的変数を変化させるためのドライバー要因の決定(目的1)にあたって、そもそも各ドライバー候補変数が制御可能な因子であるかを評価することも重要です。
仮にドライバー候補変数が制御不可能なものであるとすると、その時点でドライバー要因(KPI)としては不適切であることは、容易にご理解いただけると思います。
ここでも、各要因が制御可能かどうかを判断するには、ドメイン(ビジネス上の)知識を活用して考えていくことになります。

検討事項3:施策実装コストの見積もり

考えられる施策の中から実際に実行する施策や優先順位を決める(目的2)にあたっては、施策実装コストの観点での評価が重要になってくるでしょう。
こちらも、精緻な分析や調査は行わずにざっくりとした経験値や感覚値で良いので、施策を実行・実装するコスト(工数・費用)を見積もってみましょう。
実行・実装するコストが小さければ、「とりあえずやってみる」という判断の可能性が高くなるでしょうし、コストが大きければ、効果(検討事項1で検討した因果関係と考えられる可能性の高さ含む)も併せて総合的に判断すべきです。

目的1:目的変数を変化させるためのドライバー要因(KPI)の決定にあたってのプロセス

目的変数を変化させるためのドライバー要因(KPI)の決定にあたっては、
まず、検討事項2:そもそもその要因は制御可能か?の評価から、スクリーニングを行い、そもそも制御可能でない要因について除外します。
次に、検討事項1:因果関係と考えられる可能性の推測結果から、ドライバー要因(KPI)を決定する、という流れで考えてみると良いと思います。
これらを表にすると以下のように整理できます。
因果関係と考えられる可能性が「不明」の場合の追加検討(とその要否)については後述します。

目的2:実際に実行する施策や優先順位を決めるにあたってのプロセス

実行する施策や優先順位を決めるにあたっては、「因果関係と考えられる可能性の高さ」と「施策実施のコスト」のバランスで施策の優先順位を決定するのが良いのでは無いかと思います。
まず前提として、リソースを無視すれば、一番好ましいのは、実際に実施・実験して効果測定することでしょう。
後述する調査や分析の選択肢もありますが、調査や分析自体は直接的にはビジネス価値(売上等)を産まないことや、因果関係の検証という観点でも実験(ABテスト)を行うことが正確であるためです。
とはいえ、リソースは有限なので、複数の施策案の中から実際に実行するものを決めたい訳です。

そこで、各施策案を「検討事項2:因果関係と考えられる可能性の高さ」と「検討事項3:施策実施のコスト」の2つの判断軸で評価し、優先順位を決定するが良いのではないでしょうか。
表にすると以下のような形で整理できそうです。

優先度が中や低の施策はチームのリソースの余力や各種状況に応じて、Go/NoGoの判断や優先度を決定することが良いと考えられます。

繰り返しですが、ここまではドメイン(ビジネス上の)知識を基に考えてみるだけの内容ではあるものの、これらの検討プロセスを試すことなく、当てずっぽうでドライバー変数を決定したり、施策を試すよりは、意義があるプロセスだと考えています。
実際、ここまでのプロセスは暗黙知的に実践されている方も多いと思いますが、今後、具体的に意識してみると良いのではないでしょうか。

注:本来、ドライバー要因(KPI)の決定や施策の優先度を考える場合に、これら3つの検討事項だけでなく、その他にも考慮すべき観点はあると思います。しかし、その他の検討事項についてはケースバイケースであること、あくまでここでは「相関関係を活かす」ことに焦点を当てていること、汎用性の観点から、これら3つの検討事項に絞って記載・提案しています。

追加検討:因果関係である可能性を明確にする検討

一方で、検討事項1のように考えてみても、各ドライバー候補変数と目的変数の関係について、因果関係と考えられるかどうかが不明瞭な場合もあるかと思います。
この際、次のアクションプランとしては「調査(定性・定量)」もしくは「因果関係(統計的因果推論)の分析」が考えられます。
これらを通じて、因果関係が不明な要因について、因果関係である可能性の高低を明確にすることが目的です。
これにより、ドライバー要因(KPI)として適切かどうかをより明確にできたり、施策の優先順位についてより明確にすることができます(下図)。

「調査(定性・定量)」や「因果関係(統計的因果推論)の分析」を通じて、下図(再掲)のうち
・①や②である可能性が高いことが分かれば上記の表で右の矢印
・①や②である可能性が低い(=③や④である可能性が高い)ことが分かれば上記の表で左の矢印
とすることができます。

「調査(定性・定量)」と「因果関係(統計的因果推論)の分析」のそれぞれの概要については次項にて説明していきます。

追加検討①:調査(定性インタビュー・定量アンケート)

一般的な話ではありますが、調査は定性的に行うインタビューと定量的に行うアンケートが主要な方法かと思います。
それぞれの手法詳細やテクニックについては、有用な書籍等がたくさんあると思いますので、ここでは割愛させてもらいます。
ここで主張したいのは、インタビューやアンケート時に意識すると良いこととして
(検討事項1:因果関係と考えられる可能性を推測する、で述べたこと同様)相関分析実施時には未観測であった心理要因やその他の行動要因を追加で取得することです。
調査を通じて、目的変数とドライバー候補の説明変数間をつなぐ未観測因子(心理要因や行動情報)を見出して、因果関係の仮説を構築できれば、①〜④のいずれであるかが推測でき、因果関係であるか否かの可能性をより具体化できるようになります。

また、定性インタビューと定量アンケートの使い分けについてもここで触れたいと思います。
定性インタビューが得意とするのは、未観測因子(心理要因や行動情報)を抽出し、因果関係の仮説を新たに構築するステップです。
一方で、定量アンケートが得意とするのは、構築した因果関係の仮説を定量的に確認することにより、確度を高めるためのステップです。
また、場合によっては、複数考えられるドライバー要因とそれらに紐づく因果仮説や各施策案から、確度が高いものを絞り込む、という観点でも有効です。
逆に定量アンケートでは、事前に未観測因子(心理要因や行動情報)とその因果関係の仮説が無いと、アンケートを設計すること自体が難しくなります。
一方で定性インタビューでは、対象ユーザーのN数が限られていることや、インタビュー対象のユーザーが意図しているユーザー像とずれているリスクがあり、確度を高めるという目的では、定量アンケートと比較した場合、向いていないと考えられます。

また、調査(定性・定量)自体にも、それなりのコスト(工数・費用)がかかることに留意が必要です。
そのため、そもそも調査(定性・定量)の価値があるかを見極めることも必要になってきます。
例えば、せっかく調査を行い因果関係である可能性が高いことを示すことができたにも関わらず、施策のコストが大きいため開発のリソースが足りず、結果として調査した意味が無かった、というようなこともあり得るかもしれません。
また、調査にコストをかけるよりも、実際に施策を実装・実験するコストの方が低いのであれば、調査せずに「とりあえずやってみる」方が良いと言えます(これは前述の通りです)。

ちなみに、グロービスのデータサイエンスチームでは、GLOBIS学び放題に関する各種要因分析を行う際に、積極的にアンケートを活用したり、UXリサーチャーと協働しながらインタビューを実施しています。
学習に関する要因を分析する上では、行動ログだけでは因果関係に関する説明ができない場合も多く、心理要因も含めた深いユーザー理解が必要なことから、アンケートやインタビューも重視しながら分析を行なっています。

追加検討②:因果関係(統計的因果推論)の分析

ここまでは調査を通じて因果関係である可能性を検討する手法を説明してきました。
次に、データ分析により因果関係を分析する方法について説明していきます。
一般的には、分析を基に因果関係を示す方法としては以下のようなものがあります。

①因果推論
因果推論=効果検証的なイメージも強いですが、見方を変えると、因果推論は因果関係を検証するアプローチとも言えます。
観察データにおいて、2変数間の因果関係を示すのに、統計的因果推論は有用な手法と言えます。
我々グロービスのデータサイエンスチームでも、施策の効果検証等のシーンで、因果推論により因果関係を確認する取り組みを行なっています。
因果推論とは何か?どんな条件下で有用なのか?GlOBIS学び放題での事例等、過去のブログに記載しておりますので、詳しくは以下をご参照ください。

②因果探索
データを基に因果の方向性も含めて特定する手法です。

①因果推論はあらかじめ変数間の因果の方向について仮定を決め、その仮定に関する因果の大きさや因果の有無を測る手法です。
例えると、X(説明変数)とY(目的変数)の相関関係が分かっている時に、X(説明変数)→Y(目的変数)の因果関係であると仮定して分析を行うことで、XがYに与える影響や因果の有無を測るような方法になります。

一方で、②因果探索はどのような因果関係があるのかの仮定を置かずに、複数の変数間の因果構造を探索的に分析する手法になります。
詳細は割愛しますが、アウトプットイメージ(他ブログより転載させてもらいました)としては以下のようなものが得られるイメージです。

https://note.com/443work/n/ne448fc97baddより

また、因果探索の意義も含めて概要については、こちらの資料が分かりやすそうでした。

https://www.nistep.go.jp/wp/wp-content/uploads/09_review20220218.pdf

一方で、データ(すなわち数値)上の計算で得られる結果ゆえに、偶然因果があるように見えるという可能性もあるので、完全に正しい確証はありません。
そのため、結果を鵜呑みにせず、ドメイン知識と照らし合わせながら結果を確認するステップは必要でしょう。

グロービスのデータサイエンスチームでは、今後、因果探索に関する取り組みを行なっていくことも検討しており、GlOBIS学び放題での学習について、複雑に絡み合う変数間の関係性を解き明かしていきたいと考えています。

一方で、因果関係(統計的因果推論)の分析についても、制約条件やデメリットが存在します。
まず、前提として(データ分析全般に言えることではありますが)必要なデータが十分ではなく実施ができない、ということがあり得ます。
具体的には、シンプルな相関分析と比較して機械学習的な手法も含まれるため、相関分析よりも多くのサンプル数が必要だったり、十分な説明変数が入手できている必要があります。
また、調査同様、分析の実施自体にもそれなりのコストがかかります。
そのため、調査同様、因果関係(統計的因果推論)の分析の要否についても、そもそも実施する価値があるかを見極めることが重要でしょう。

ここまでに記載した 追加検討(調査・因果関係の分析)の位置付けと検討フローについては以下の様に整理できると考えられます。

目的1:目的変数を変化させるためのドライバー要因(KPI)の決定のための追加検討

目的2:実行する施策や優先順位を決めるための追加検討

まとめ

ここまでの話を要約して、本記事の内容を終えたいと思います。

前提として、相関分析を行う背景や分析後の状況として以下のようなことが多いのではないかと思います。

  • 目的とする変数(例えば売上)を変化させるためのドライバー要因を見つけたり、それらの要因に影響を与えうる施策の中から優先順位を判断したい

  • このために、一般的に相関分析が行われることが多い。

  • 相関関係を見つけることで、数ある変数の中から、目的変数に影響がありそうなドライバー「候補」となる変数を絞り込むことができる。

  • 一方で、相関≠因果なので、本当はドライバー要因では無い可能性や、施策を実行しても目的変数へは効果が無い可能性もある。

  • 「相関≠因果なので、注意しろ!」と言われるが、どのように注意すべきかは不明瞭(言語化できていない・汎用的な対策が無く再現性がない!)

相関関係を見つけた時、どのように注意して対応すべきなのかは、2つのそれぞれの目的に応じて、以下の図の様なプロセスや以下表の様な基準で判断を行うのが良いのではないかと思います。

目的1

目的2

  • 上記を検討する中でのポイントは以下の通りです。

    • 「検討事項1:因果関係と考えられる可能性を推測すること」が特に、相関分析の結果を扱う上では重要。

      • 相関分析実施時には未観測であった心理要因やその他の行動要因を想像して考えながら視覚化してみて、因果関係の仮説を構築してみる。

      • ドメイン(ビジネス上の)知識や想像するユーザー心理に基づく仮説ベースのロジックや感覚に基づいて判断する程度で良い。

    • 因果関係と考えられるかどうかが不明瞭な場合の追加検討として、調査(定性・定量)もしくは因果関係(統計的因果推論)の分析が考えられる。

      • 因果関係である可能性の高低を明確にすることが目的で、その結果、ドライバー要因(KPI)として適切かどうかや施策の優先順位について、より明確にすることができる。

      • 一方で、調査(定性・定量)も因果関係(統計的因果推論)の分析もそれなりのコストを要したり制約条件が存在するので、実施の要否についても検討すべきである。

      • 調査の手法として定性インタビューや定量アンケート、因果関係の分析手法として因果推論や因果探索といった手法が考えられるが、それぞれの特徴を理解して、状況毎に使い分けるべき。

実際、今回ここで書いたことはビジネスの現場で暗黙知的に理解・実践されている方も多いのではないかと思いますが、今後、相関分析の結果を活用する度に、ここでの内容を思い出して活かしてもらえると嬉しいなと思います!!

グロービスで一緒に働くデータサイエンティストを募集しています!

グロービスのデータサイエンスチームでは、一緒に働くデータサイエンティストを探しています!
共に、社会人学習に関する様々な要因を解き明かし、社会人の学びの未来を切り開いていきましょう!
まずは、カジュアル面談を通して、あなたに合う組織かどうか確かめてみませんか?お気軽にご連絡お待ちしています!


この記事が気に入ったらサポートをしてみませんか?