分析時の思考パターンについて

Fumie Katano

分析者はデータ分析をする上で、しばしば事象同士の比較を行います。その比較対象は相関の関係にあり、因子の作用や因果の強さを見落とすことが結論へのミスリードに繋がりかねません。

そこで分析する時の思考パターンの注意点をまとめました。

事象の関係性について

データ分析をする上で、思考の核心のメカニズムから事象の関係性を把握すると言うことが重要になります。
「y=ax+b」数学の関数で相関を表せますが、日常には相関が多数成り立っています。

例)
降水量と河川の増水
自動車のスピードと事故率
身長と体重

さらに細分すると、相関には因果関係にあるものと、そうでない単純相関があります。因果関係は片方の事象がもう片方の事象を引き起こす”原因と結果”の関係です。

上記の例だと、「降水量と河川の増水」「自動車のスピードと事故率」がその関係です。そして「身長と体重」の関係は単純相関になります。


第3因子に注意する

例えば、「夏になると気温が上昇し、ある店舗のビールの売上量が増す」という一つの相関があります。また、同じく「夏になるとある店舗での肌着の売上が増す」という相関があります。

この2つのグラフを見て、ビールと肌着の売上量に相関があるということに気付いた人が、ビールの売上アップのために肌着のプレゼントキャンペーンというものを行いました。

これが第3因子を見落としてしまったがために、検討違いのキャンペーンを行なってしまったという結果になりました。

常識や経験によって定性的に判断される場合にはこの仮説が正しいものかを容易に判別できますが、多数の変数を用いて複雑に分析を行う場合には、この第3因子を見落としてしまうことは珍しくありません。


因果関係には強さがあることを意識する

因果関係を正しく把握するために、因果には強さがあることも注意する必要があります。

「Aさんが試験に合格した」ということを例に説明します。Aさんが試験に合格した要因はいくつかありますが、下記の3点を挙げてみました。

上記が合格の要因だとすると、その因果の強さは a → c にかけて弱くなります。購入した参考書がどんなにその試験に合っていたとしても、あまり勉強しなかったら試験には合格しなかったかもしれないし、体調管理も同じことが言えます。

このケースではAさんがどれほど勉強したかが、合格に大きく作用したかが関わっているのです。

例えば国政選挙の投票率も同じで、一人が投票に行かなかったからといって日本の投票率全体に及ぼす影響は限りなく0%に近いですが、それが100万人いたとしたら、1人と比較して投票率に及ぼす影響は大きく異なるものになります。
因果関係の強さの把握ができていてこそ、ある問題を解決するための手立てを考える際のミスリードを防ぐことができます。


このように、私たちは生きている中でたくさんの相関を持ち、無意識に因果関係を測る思考パターンができています。ただしこれを分析に当てはめるとうまく使えないことがあるので、比較して因果関係をつかむことを意識的に行う必要があります。

また、その因果を正しく捕捉するために、十分な経験と知識を持って判断することが、問題に対する仮説立案のミスリードの抑制に繋がります。


この記事が気に入ったら、サポートをしてみませんか?
気軽にクリエイターの支援と、記事のオススメができます!