心理学統計③
記述統計の話
今回は記述統計の話になりますが、高校の数学でやったことがあるものなので、軽く流していきます。より詳しいことが知りたい人は、詳しく説明しているサイトがあるのでこちらから。
受験辞典/数Ⅰ/データの分析
https://univ-juken.com/category/sugaku-1/data-analysis
ぶっちゃけ、上のサイトで事足りるのですが、個人的にまとめているものなので一応殴り書きをしておきます。
代表値
データの中で最も一般的な値を示す統計量です。
平均値、中央値、最頻値の三つが主になります。
平均値とは、データ全体の和をそのデータの個数で割った数です。
中央値とは、データ全体を大きさ順に並べたときに、データの真ん中に位置する数字です。
最頻値とは、そのデータで最も多く出現する数字のことです。
散布度
散布度とは、データが散らばっている程度を示す指標です。主な散布度を表す統計量として、分散、標準偏差、四分位偏差などがあります。
データを「a」、平均を「b」、データの個数を「c」とおくと、
{(a-b)+(a'-b)+(a"-b)……}^2/c
が分散になります。わからなかったらごめんなさい。面倒くさいのでこれで許してください。
分散の平方根をとると標準偏差になります。
「レベル」の平均は81です。
{(95-81)+(84-81)+(79-81)+(89-81)+(71-81)+(91-81)+(92-81)+(83-81)+(75-81)+(51-81)}^2/10=170.444
になるはず。170.444の平方根は、13.055になります。
四分位偏差とは、データを中央値と、さらに第一四分位数と第三四分位数に分け、その第一四分位数と第三四分位数の差を二分の一した数字です。
上記のことを図で分かりやすくしたものを、箱ひげ図と言います。
これです。
大変大雑把に説明しましたが、一番最初に示したサイトを見ると分かると思うので、この高校生の分野はそちらで確認してくださるとうれしいです。
なんで大学生になってまで高校の内容を90分聞かなあかんのだ。
この記事が気に入ったらサポートをしてみませんか?