高等学校 情報Iの要点 情報通信ネットワークの仕組み #6

リュディアです。引き続き高等学校 情報Iの要点 情報通信ネットワークの仕組み をまとめていきます。

高等学校 情報Iの要点 情報通信ネットワークの仕組みのまとめへのリンクをまとめておきます。

今回は量的データの分析手法について見ていきます。分析手法と書くと大袈裟ですが、どのような数を見ると量的データの傾向をつかむことが可能か見ていくということです。

これから見ていく数は統計量統計値と言うのですが、まず皆さんご存知の平均値、中央値、分散、標準偏差です。他に最低値や最高値などもあげられます。四分位数はご存知でしょうか?どのように計算するか忘れたものもあるかもしれませんがまずは用語だけです。

では順番に見ていきましょう。平均値は大丈夫ですね?中央値はどうですか?中央値はデータを小さな方から並べたときに中央にあるデータのことです。これも大丈夫ですね。平均値や中央値を含む代表値という考え方について詳しくしりたい方は私どもリュディアで以前に用意したまとめをご覧ください。

では分散標準偏差はどうでしょうか?例えば2つのクラスでテストの平均点がどちらも50だとします。しかしA組は最低が10点、最高が100点であるのに対し、B組は全員が50点だとしましょう。この場合、同じ平均点が50であってもA組とB組では状況が違いますよね?このようにデータがどのような広がりをもつかを示すのが分散であり標準偏差です。分散、標準偏差の詳細を理解したい方は私どもリュディアで以前に用意したまとめをご覧ください。

最後に四分位数です。これもデータのばらつきのを表現する指標です。データの中央 50% が分布している範囲のことです。ある数値データが与えられたとします。そのデータを小さい数から大きい数になるように並べました。そのとき中央にある数を第2四分位数と呼びます。データが偶数個の場合は中央のデータが2つ存在しますので2つのデータの平均値を第2四分位数とします。

第2四分位数が決まると第2四分位数を基準としデータを前半、後半の2つにわけることが可能です。前半をさらに 2 つにわけたとき中央にある数を第1四分位数と呼びます。後半を2つにわけたとき中央にある数を第3四分位数と呼びます。つまりそれぞれの四分位数は以下のようになります。

第1四分位数:下位 25% までの数を含む上限となる数
第2四分位数:下位 50% までの数を含む上限となる数
第3四分位数:下位 75% までの数を含む上限となる数

図で見ると以下のようなイメージになります。

また分布具合の情報を視覚的に捉えるために箱ひげ図を利用することも多いです。箱ひげ図は以下のようなものです。この箱ひげ図の例を見てもらえばわかるように最大値、最小値、四分位数、中央値(第2四分位数)がどのようにちらばっているのかすぐにわかりますね。

皆さんが慣れ親しんでいるものや初めてのものまでいろいろとあったと思いますが、いずれも計算方法よりは概念をつかむことが大切です。計算は今は機械がやってくるので、このような情報が欲しいから何を計算すればよい、と判断できることが重要となります。少しずつでよいので慣れていってください。

高等学校 情報Iの要点 情報通信ネットワークの仕組みに関するまとめの続きは以下からどうぞ。

では、ごきげんよう。

この記事が気に入ったらサポートをしてみませんか?