見出し画像

度数分布表の見方【統計学をやさしく解説】

この記事の主な内容

度数分布表とは

度数分布表とは、データを複数の区間に分割して、それぞれの区間にいくつデータが存在するかを調べ上げた表です。分割したそれぞれの区間のことを階級と呼び、そこに属するデータの数を度数と呼びます。0以上10未満、10以上20未満、20以上30未満、30以上40未満の階級を持つ度数分布表を考えましょう。各階級の一番大きい数字と小さい数字の差はそれぞれ10(=20−10, =30−20,…)なので、階級の幅が10であると言います。階級の幅が階級ごとに異なると各階級に対して度数の大小が分からなくなってしまうため、階級の幅は通常一定です。最後に、階級の階級値は階級の真ん中の値となります。同じ例を用いると、それぞれ5、15、25、35です。このように、度数分布表は階級と度数が対応しており、階級の性質を把握するため階級値や階級の幅を参照します。

度数分布表の見方

下のグラフは25人の生徒が100点満点のテストを受けた際の度数分布表です。

得点が5つの区間に分けられているので、階級は左側の列にある0以上20未満、20以上40未満、…の欄に対応すると分かります。また、階級ごとのデータの数は人数で表されるため度数は右側の列にある3、3、5、…の欄に対応すると分かります。階級の幅はそれぞれの階級に着目して、20−0=20、100−80=20などと求められます。最後に、階級値は中央の値を選択すればよいので、上から順に10、30、50、70、90となります。

これらの基本的な情報を抑えたうえで、次に度数分布表からデータの特性について考えます。60以上80未満の階級は最も度数が高く、続いて40以上60未満、80以上100未満の階級となっています。また、0以上20未満、20以上40未満の階級は他の階級と比べて度数が低いため、得点が低かった人が多くないことが分かります。
加えて、度数分布表を見ることによって中央値がどの階級に属するかを確認することができます。25人の得点を低い順に並べたとき、中央値となるのは13番目の生徒の点数です。そのため、度数分布表の度数を下の階級から順に足し合わせることで中央値の階級が分かります。0以上20未満、20以上40未満はそれぞれ度数が3なので、40点以下を取った生徒は6人です。次に、40以上60未満の階級の度数は6なので、60点以下の点数の生徒は12人です。次に高い点数の生徒は次の階級である60以上80未満に属しているため、13番目に低い点数=中央値の階級が分かりました。
中央値と違い、平均値の階級は計算によって求められるケースがあれば求められないケースもあります。そのため、度数分布表から平均値を概算するための方法があります。度数分布表のデータだけではそれぞれのデータの正確な値が分からないため、近似的に属する階級の階級値をデータの値だとします。上の度数分布表の例の場合、10点の生徒が3人、30点の生徒が3人、50点の生徒が6人、70点の生徒が8人、90点の生徒が5人いると考えることができるため、
平均値 ≒10×3+30×3+50×6+70×8+90×5=57.2
となります。

度数分布表の活用

度数分布表を利用することで、データを簡単にまとめることができます。25人のテストの個別の得点を眺めているだけでは高得点層の人数が多いことや中央値が60以上80未満点の階級に属することは分かりません。反対に、前述したように中央値や平均値の具体的な値を度数分布表から計算することはできないためデメリットも存在します。
また、度数分布表を作成することで、度数分布表を視覚的に見やすい形で表現するヒストグラム他のデータとの比較の際に有用な度数分布多角形を作成することができます。このように、表やグラフを用いてデータを要約する手段を習得していきましょう。


統計学、データ分析、数字力、数学などが学べる各種無料講座を開催しています。お気軽にご参加ください。セミナー一覧はこちらより⇒「和からのセミナー一覧」

●お問い合わせフォームはこちら

この記事が気に入ったらサポートをしてみませんか?