G検定 / 統計検定 データの視覚表現 #4

株式会社リュディアです。引き続きデータの視覚表現、いわゆるインフォグラフィックについてまとめていきます。

過去の G検定 / 統計検定 データの視覚表現についてのまとめは以下を参照してください。

今回は箱ひげ図についてまとめてみます。四分位数について既知であることが前提となりますので以下のまとめを先に読んでおいてください。

50人分の100点満点のテスト結果があるとします。例えば、以下のようなデータです。以前のまとめで使ったものと同じです。

画像1

この50人分のデータの四分位数を求めると以下のようになります。

画像2

この情報をベースに箱ひげ図を書くと次の図のようになります。

画像3

箱ひげ図はなかなか使い勝手がよく1次元データではよく用いられます。箱ひげ図は四分位数と最大値、最小値を使ってデータの分布を表現しています。図からもわかるように四角で囲まれている部分が全データの半分が含まれている範囲です。確かにいろいろな情報が含まれていることがわかると思います。

箱ひげ図が複数並んだグラフが使われることも多いです。例えば以下のように各クラスの箱ひげ図を並べると単に平均点の比較以上にクラス間の比較が行いやすくなります。

画像5

最後にエクセルで四分位数を求める方法と箱ひげ図を書く方法です。生データが B4:B53 に50個並んでいるとします。以下の数式で四分位数が求まります。

= QUARTILE(B4:B53, 0):最小値、=MIN(B4:B53) と同じ結果
= QUARTILE(B4:B53, 1):第1四分位数
= QUARTILE(B4:B53, 2):第2四分位数
= QUARTILE(B4:B53, 3):第3四分位数
= QUARTILE(B4:B53, 4):最大値、=MAX(B4:B53) と同じ結果

また箱ひげ図は生データを選択した状態で挿入メニューからすべてのグラフを選択肢以下の画面で箱ひげ図を選択します。

画像4

今回は箱ひげ図についてまとめてみました。非常に汎用的で強力なツールです。積極的に使ってみてください。

G検定 / 統計検定 データの視覚表現に関するまとめの続きは以下からどうぞ。

では、ごきげんよう。


この記事が気に入ったらサポートをしてみませんか?