見出し画像

【データ分析】度数分布表とヒストグラムをExcelで可視化して学ぶ

統計学はExcelやPythonで可視化しながら学ぶと理解しやすいことがわかったので、全体像をみるための「度数分布表」「ヒストグラム」をExcelで作りながら学んでいきます。

この記事でわかること

「度数分布表」「ヒストグラム」をExcelで可視化しながら学ぶ方法

用語の解説

階級:それぞれの値の範囲。
度数:各階級に含まれるデータ数。 例えば年齢が「25歳以上30歳未満」の階級であれば、度数は「5」です。
相対度数:各階級の度数が全体に占める割合のこと。 体長が「25歳以上30歳未満」の階級であれば「(5÷100)×100=5%」となります。
度数分布表:”度数”つまりデータ数がどのように散らばっているかを表にしたもの。
ヒストグラム:度数分布表をグラフにしたもの。

Excelで度数分布表とヒストグラムを作る

1. 度数分布表を作成

まず練習データをExcelで生成します。
①A列:注文件数
A2セルに
=RANDBETWEEN(1,100)
を入力。
31行目までコピーをして、1~100のランダムな値のデータを30行作ります。


②B列:階級
階級を20件ずつ7つ設定しました。

③C列:階級の範囲が見やすいように補足しています。

④D列:度数
D2セルに以下入力。
=FREQUENCY(A2:A31,B2:B8)
これで度数(階級ごとのデータ数)が入ります。

2. ヒストグラムの作成

次にヒストグラムを作ります。

C・D列を選択して、「挿入」「ヒストグラム」を選択。
ただし設定前は横軸が2つになってしまい正しく表示されません。


「+」ボタンをクリックして、「軸」「その他の軸オプション」をクリックします。
「分類項目別」にチェックすると7つの階級すべて出力されました。
一番多い部分の色を変えたり、軸ラベルを追加したりして、見えやすく調整して完成。


まとめ

データ分析でよく使われる、度数分布表・ヒストグラムをExcelで作ってみました。最後まで読んでいただきありがとうございました!

この記事が気に入ったらサポートをしてみませんか?