統計WEB 単元6「データの標準化」学習

←単元5 単元7→

こんにちは。hoshiです。☕
今回は単元6「データの標準化」学習の私的まとめを掲載していきます。

①レーダーチャートを作ってみよう

6-1. レーダーチャート作成の極意

🌟レーダーチャート:いくつかの項目の大小を1つのグラフで表したグラフ。同時に別データとの比較も簡単にできます。

・N個の項目がある場合には正N角形のグラフに。
・各データを各項目の軸に対してプロットする。
・プロットした点同士を結んで多角形を作成する。

※作成の際、上のリボンにある挿入タブでおすすめグラフの中に「レーダー」項目がありそちらで作成しました。

図1:体力テストの成績


②データを標準化してみよう

6-2. データ標準化の極意

・標準化すると、標準化したデータの平均は0に、分散、標準偏差は1になります。
これにより、異なる項目のデータであってもその大小を比較できるようになります。すなわち、数値が大きければ大きいほど成績が良いことを表します。

【標準化の公式】

(元のデータ-平均値)/標準偏差

※標準偏差については前回の記事にも書いてあるのでお手すきがあればご覧ください🙇


例:くろのボール投げを標準化すると・・・
くろのボール投げの結果が2点、ボール投げの平均値4点で標準偏差2だったので、

(2点-4点)/2=-1.0

図2:標準化後のデータを抜粋(矢印は例、黄色は最も大きい値)


③偏差値を求めてみよう

6-3. 偏差値の極意

・偏差値=全体における得点の位置を示す位置
・元のデータを平均を50、標準偏差が10となるように変換した値のこと。

【偏差値の公式】

(元のデータ-平均値)/標準偏差×10+50

※標準偏差とはデータのばらつき具合の平均

図3:偏差値の一例
※くろの走り幅跳びは偏差値90と非常に高くなっている。

<偏差値のその他特徴>
・偏差値が高いほど成績が良く、低いほど成績が悪いことを示します。

・異なる科目や競技で同じ点数だった場合でも、偏差値は等しくなるとは限らない。科目や競技の平均値や標準偏差が異なる場合、偏差値は異なったものになります。

・偏差値は100以上の値やマイナスの値をとる場合があります。標準偏差が小さく、平均値からかけ離れた点数を取った場合には偏差値は非常に大きな値や小さな値をとります。

<偏差値の豆知識>
🌟偏差値50:上位50%(=100人中50位)
🌟偏差値60:上位15.88%(≒100人中15位)
🌟偏差値70:上位2.28%(≒100人中2位)

※問題の難易度に大きな差があるテストだとヤマが二つできるヒストグラムになるため偏差値はあてにならない。

最後に、別の参考例として過去に私がnoteに投稿したこちらの記事に私の偏差値がのっておりちょうど近しい内容があるので以下に添付します。

この中の模試成績で理科・偏差値49.9とありました。これは偏差値50に限りなく近いので理科を受験した層のほぼ半分くらいの位置にいるということになります。

次章は「データの相関」になります。

予定は、7-1「バブルチャートを作ってみよう」7-2「データの相関を見てみよう」7-3「データの相関に注意しよう」です。

それでは、この辺りで失礼いたします。

午後も頑張りましょう。🍵

最後まで読んでいただきありがとうございます! 始めてまだ間もない者になりますが、いいねとシェアをいただければ嬉しいです。拙い文章ですがこれからもご拝読の程よろしくお願いいたします🙇