見出し画像

【Spreadsheetsデータ分析】CHITEST関数でカイ2乗検定

¡Hola! マイコです。

先日、統計検定2級を受けてきましたが、統計検定では確率だけでなく、統計量も電卓を使って計算します。電卓操作になれていない私にとっては苦戦ポイントでした。
電卓だと手間がかかる計算も、スプレッドシートでは一瞬でp値まで出してくれます。技術ってスバラシイ。

ということで、今回はスプレッドシートでカイ2乗検定を行う方法を紹介します。

例題:

流入経路AとBでユーザのアクティブ人数に差があるか検定したい。流入経路からは780人が登録、アクティブ人数は621人、流入経路Bからは1119人でアクティブ人数は537人だった。

仮説を設定

帰無仮説:流入経路とアクティブユーザ数には関係がない
対立仮説:流入経路とアクティブユーザ数には関係がある

検定の準備

まず観測値のクロス集計表を作ります。

観測値

続いて、流入経路とアクティブ人数が関係がないことを前提にした理論値のクロス集計表を作ります。

理論値のクロス集計表

CHITEST関数でP値を算出

CHITEST関数の使い方は次のとおりです。

=CHITEST(観測値の表範囲, 理論値の表範囲)

表範囲は、周辺度数を除いた2*2のセル部分を指定します。

CHITEST関数を入力

結果

CHITESTの結果、0.00000000018と表示されました。
有意水準1%よりも小さな値であることから、「帰無仮説:流入経路とアクティブユーザ数には関係がない」は棄却され、「対立仮説:流入経路とアクティブユーザ数には関係がある」が採択されます。

今回のデータでは、流入経路によってアクティブ人数には関係があるといえます。

この記事が気に入ったらサポートをしてみませんか?