見出し画像

【初心者向け】初めての分散分析 データ分析ツール【エクセル】

■分散分析とは

分散を利用して平均値を分析する手法です。「ちょっと何言ってるかわからない!」という方も多いと思います。

3群以上のデータ、もしくは3つ以上の条件下で分類されたデータの母平均の差を検定します。例えば、薬の投与量は効能に効果を与えるか、クラスごとのテストの結果はどうかなど、母平均の差を検討するために活用されます。ただ、結果は差が有るかどうかしか分かりませんのであしからず。

■Excelの分散分析のやり方

①元データ

106_分散分析_エクセル-1

②ツールを使いにあたり、下記のようにデータを整形する必要があります

106_分散分析_エクセル-2

③データ→データ分析→分散分析:繰り返しのある二元配置

104_回帰分析_エクセル-1

104_回帰分析_エクセル-2

106_分散分析_エクセル-3

④入力範囲の設定
入力範囲→列名や行名を含めたデータ全体を指定
1標本あたりの行数→一般会員、ゴールド会員のそれぞれのデータ数
出力先→表示したい左上のセルの位置

106_分散分析_エクセル-5

⑤結果表示

106_分散分析_エクセル-6

■結果の見方

【ポイント】
・P-値・・・帰無仮説が起こる確率(各要因のデータ群の平均が等しいと仮定すること)
→一般的に5%以下だと帰無仮説を棄却(否定)できるので、平均点の差があると考えられる
今回の場合、「一般会員、ゴールド会員のそれぞれの上半期と下半期の来店数に違いが無い」ということです。

・標本(セルA42)
→横方向の上半期と下半期の来店数の事です。
P-値は0.001で0.1%<5%なので、5%より低いので帰無仮説を棄却出来ます。上半期と下半期で来店数の影響があったという事になります。

・列(セルA43)
→縦方向の元データの一般会員とゴールド会員の事です。
P-値は0.52で52%>5%ですので帰無仮説を棄却出来ない、つまり一般会員だろうとゴールド会員だろうと来店数に影響は無かったという事になります。

・交互作用(セルA44)
→P-値は0.83で83%>5%よりですので帰無仮説を棄却出来ない、来店数に影響は無かったという事になります。

【平均】
上半期のゴールド会員の来店数が一番多いですが、交互作用での違いがないことが分かってますので、上半期のゴールド会員の来店数を上げるには全体的な施策が有効そうです。

▼関連記事

エクセルによるt検定の使い方 データ分析ツール【Excel】

エクセルで相関係数を求めるには? データ分析ツール/CORREL関数【Excel】

エクセルの散布図データの意味と作り方【Excel】【Windows】


この記事が気に入ったらサポートをしてみませんか?