見出し画像

[PSPP]無作為性の検定

ラン(連)検定

 ラン(連)検定(Runs Test)は、数列の並び方の無作為規則性つまり、無規則性・偶然性の検証を行う検定法です。2値データを用いる検定ですが、それ以外のデータは、ある基準値未満と基準値以上で2値に変換することで、用いることができます。

 その基準には中央値が用いられることが多いですが、それに基づいて説明すると、

①無作為であれば、理論的には中央値以上の大きい値(以下、A)も、中央値未満の小さい値(以下、B)も1/2の確率でサンプリングされるはずである。
②AもBも連続しすぎるのも、入れ替わりすぎるのもおかしい。
③よって、AやBが連続する程度に着目することで、無作為性を検証できる。

というふうに考えることができます。

 この場合、検定の帰無仮説は「AとBの並び方は無作為である」であり、対立仮説は「AとBの並び方は無作為ではない」となります。

 AまたはBの一続きのまとまりを連(run)といい、その連に含まれる記号の個数を連の長さと言います。A・Bが連続しすぎると、連の長さが長くなり、そのため連が少なくなります。逆に入れ替わりすぎると連の長さが短くなり、そのため連が多くなります。よって、さきほどの③の「AやBが連続する程度」は、この連の数によって捉えることができます。

 記号の数をn、Aの数をn1、Bの数をn2、連の数をKとしたとき、帰無仮説のもとでnが十分に大きい場合、Kは以下の平均値(μK)と分散(σK2)の正規分布に従うことが知られています。

よって、確率変数

を用いて、検定を行うことができます。
 帰無仮説が「AとBの並び方は無作為である」ですから、検定結果が有意とならずに、棄却されなかった場合、無作為であったと言うことができます。

 以下、さいころの出目を使って説明します。

 表のように、さいころを50回ふったときの出目を記録したデータがあったとします。このさいころが通常のものであれば、出目は無作為になっており、もしもイカサマがあると出目は無作為にはならないはずです。
 なお、実際のデータは、次のような形で入力されています。

 ラン(連)検定(Runs Test)では、先に述べたように2値データを扱うわけですが、前もって2値に変換しておく必要はありません。いかに説明する手順の中で、基準を設定することで、分析過程で自動的に変換されて処理されます。

・[分析]→[ノンパラメトリック検定]→[ラン]を選択。

・変数「さいころ」を右の欄に指定します。
・[分岐点]の[メディアン]にチェック。

・[OK]をクリック。

※この場合、さいころですから出目は1~6と分かっていますので、[ユーザーの指定]で、たとえば「3.5」など明らかに「1,2,3」と「4,5,6」に分けられる基準を設定してもかまいません。また、すべての[分岐点]を指定して、同時に検定することも可能です。

出力の見方

 「検定値(中央値)」として、[分岐点]で設定したのが「メディアン」つまり「中央値」であることが明記され、その値が4.00と示されています。

 [ユーザーの指定]をしていた場合、( )は表示されず、「検定値」とだけ表示されます。

 「ケース<検定値」は、検定値未満の個数で、ここでは23、「ケース≧検定値」は、検定値以上の個数で、ここでは27です。「全ケース数」は50です。
「ラン(連)の数」は28となっています。

「Z」は、先に説明した確率変数で、0.62、これを用いた両側検定の有意水準(有意確率)は0.534となっています。

 有意確率が0.05よりも大きいので、帰無仮説は棄却されません。

 よって、ここではさいころの出目は無作為性があり、イカサマがされていない可能性が高いと言えます。

この記事が気に入ったらサポートをしてみませんか?