見出し画像

偏差値

偏差値についての解説

数列というのは一定の規則に沿って並べられた数の列のことです。また、というのは合計のことです。例えば、1, 2, 3 という三つの数の合計(和)は 1+2+3=6 です。ここで、数列の和というのは一定の規則に沿って並べられた数の列の合計のことです。例えば、2, 4, 6, 8, 10 というような +2 ずつ増加する数の列があったら、この数列の和は 2+4+6+8+10=30 になります。こうした数列の和の様子を一般的な仕方で表記すると以下のようになります。

$$
\displaystyle \large{ \sum_{i=1}^{n} a_i =  a_1 + a_2 + a_3 + \cdots + a_n}
$$

上記の式に含まれている「Σ」は「シグマ」と呼ぶばれるもので数列の和を表す数学の記号です。 $${a_1}$$ から $${a_n}$$ までの数列の和のことをこのように表記します。

統計学には分散(variance)と呼ばれる概念があり、上記の数列の和の概念を用いて求めることができます。以下のような式です。

$$
s^2 = \frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2
$$

$${s^2}$$ は分散の値を表す記号です。 $${\overline{x}}$$ は$${x_1}$$ から$${x_n}$$ までの平均値です。 $${n}$$ はデータとなる個々の数値の総数を表し、 $${x_i}$$ は個々の数値を表しています。

これは簡単に言うと、全部で$${n}$$個存在する個々の数値からそれらの値の平均値をそれぞれ引き算し、その計算の結果として得られたすべての数値の二乗を合計して最終的にそこから得られた値をデータの総数を表す $${n}$$ で割り算したものです。

分散を見るとデータ全体の散らばり具合が分かります。分散の値が大きいほどにそのデータ全体の散らばり具合は大きく、小さいほどに散らばり具合は小さくなります。データとなる個々の数値からそれらの平均値を引き算してそれらの間の差(偏差)を求めていますから、その差が大きければ大きいほどに個々のデータの数値が平均値から離れて散らばっていることになります。そうした個々の数値の散らばり具合の和を求めてデータ総数である$${n}$$で割ることで平均値を導き、結果としてデータ全体の数値の散らばり具合を表しています。

では、この分散は具体的に何に使用できるのでしょうか? 例えば、これを用いて偏差値というものを求めることができます。以下の式により導くことができます。

$$
T_i=\frac{10(x_i-μ_x)}{\sigma_x}+50
$$

この時、 $${T_i}$$ が偏差値です。 $${x_i}$$ は個々の数値。 $${μ_x}$$ は $${x}$$ の平均値で既に述べた分散を求める数式で言うところの $${\overline{x}}$$ に当たります。そして $${\sigma_x}$$ は標準偏差(standard deviation, SD)と呼ばれる値で、分散の非負の平方根を取ることで求められます。

この数式において偏差 ($${x_i-μ_x}$$) が 0 である場合には偏差値は 50 になります。また、それぞれの個々の数値である $${x_i}$$ がすべて等しい時は数値の散らばりがなくなりますから分散が 0 になり、そこから求められる標準偏差も 0 となります。この時、式中の分母に 0 がくることになってしまうので偏差値がこの式では定義できないことになります。この場合、それぞれの偏差値はすべて 50 とすることになっています。

偏差値についての考察

偏差値のような統計的な概念は非常に上手く「平均」の概念を用いているように思われます。ただ、とどのつまりこの平均というものが何であるのか? それが私にはよく分からないんですよね(笑) 私たちが平均を取るという行為をする時に具体的に何をしていることになるのか……。そういう問題もあると思います。

平均値というのはいくつかの具体的なものについてのデータの数値を合計し、その値をデータとなる数値の総数で割り算することで求められるとされる極めて初等的な知識の一つです。しかし平均値とは何でしょうか? それぞれの具体的なデータに関する数値のように何か具体的な現象によっているような数値ではないようにも思われます。

一説では、平均的なフォルムは美しい……と考えるものもあるようです。言われてみれば、確かにそうした傾向はあるかもしれません。しかし、そうだとすればなおのこと平均とは何か? という問題が気になります。そもそもなぜ平均は美しいと知覚されるのでしょうか? 色々と考えてくると極めて不思議な概念です。

そしてそうした平均を基礎として、標準偏差や偏差値のような様々な指標が芽吹いてきます。これらの指標は現実から得られたデータに対するいくつかの数的処理によって私たちの前に導かれてきますが、そもそもその基礎となっている平均の概念自体が私には今一つよく分かりません。

平均はそもそも現実的な値であるのか? それとも何らか架空の値であるのか? そうした平均という謎の概念に立脚した偏差値などの概念はどの程度有効と言えて、どの程度使用されるべきなのでしょう? 私はこの平均なる概念についての理解に画期的な一歩を期待しているのですが、まずもって自分が何を分かっていないのかから分からず、いつも頭を抱えています(笑)

初等的な知識というのは理解するのが本当に難しいなと思います。算数などの初等的な学問を勉強している小学生たちは本当に偉いと思いますね。

小学校、中学校、高校、大学というような系列を見た時に、必ずしも小学校で習うことが中学校以降で習う内容に劣っていることはないように思います。中には小学校の方が難しいという場合もあるかもしれません。このように一般的に下位に分類されているものも厳密には「下位」とは言えません。

例えば、根本的なメカニズムとしては初等的な算術であっても、それを極度に洗練させて発展させれば「簿記」の場合のような素晴らしい分野が開花することもあると思います。このように世の中というのは単純な上下関係には収まりきらない、多くの現実的で難しい問題であふれているようです。

さて、そうだとすれば私たちが「偏差値」によって例えば学校に等級をつけて差別化することにどの程度の意味があると言えるでしょうか? そうした等級の設定をある程度は許すことにするにしても、むしろそうした階級的な秩序において下位とされるものの方がかえって優れていることがたくさんあるのではないでしょうか? つまりいわゆる偏差値は絶対の概念とは言えないと思います。

偏差値などの統計的な指標はとても便利ではありますが、あまり依存しすぎずに大切なことは自分で確かめていきたいなと思いました。

この記事が気に入ったらサポートをしてみませんか?