見出し画像

SQLで度数分布表を作るときのための階級数の目安を知るスタージェス公式を計算する方法(BigQuery編)

そもそも度数分布表って?

例えば学校のテストで
0-20点、20-40点、40-60点、60-80点、80-100点
の5つの階級に分けてその人数を集計したような表のことを言います

わかりやすいサイトはコチラ

階級って?

0-20点、20-40点、40-60点、60-80点、80-100点
これが階級です。
今回適当に5つの階級に分けましたが、
では何かの売り上げ表に対してはどんな階級付けが望ましいのでしょうか?
適当につけるっていっても、そのテキトーのあたりさえつかないと悩んじゃいますよね。
そこで「スタージェスの公式」をつかって大体の明安階級を付けます。

1+log2n

スタージェスの公式は「1+log2n」で求められます。
logは対数を求める関数です。
ExcelにもGoogleスプレットシートにも存在する関数なので
まず表計算ソフトで理解してみたい方は
コチラのサイトを参考にしてみてください。

この公式に当てはめた場合
テストの点が60通りの点数があり、それをどの程度の階級に当てはめるのがいいかは、ExcelおよびGoogleスプレットシートだと

=1+LOG(50,2)

となります。答えは「6.64385619」6か7くらいで分けるといいってことですね。最終的な判断は人間が下すのであくまで「目安」とするといいともいます。

ここから先は

402字

¥ 100

この記事が気に入ったらサポートをしてみませんか?