見出し画像

「度数分布表」についてのちょっとしたモヤモヤについて

Cover Photo by Wim van 't Einde on Unsplash

昨日、中学1年の(2)「経験的確率」を書き終わった後、ちょっと面白い動画が目に留まりました。予備校講師を長くしておられた方のようで、YouTubeで授業動画をたくさん配信しておられます。

1数_度数分布表イマチュウ塾

上にリンクした動画では、体力テスト「垂直とび」の成績を度数分布表にまとめるという内容ですが、言葉の説明や、実際の作業を丁寧にしておられるところがわりと好印象でした。
その中で、「度数」について、小学校では人数とか個数とかいっていたけど、中学校では、何についても「度数」と言います、「数」の事です、というような話をしておられました。実際の作業では、「30」というデータがあったときに、「30は2つあるけどどっちに入る?」「そう、30未満じゃなくて、30以上の方だね」みたいに、とても丁寧にお話をしておられます。このあたり、塾講師としての指導経験の豊かさを感じました。

とはいえ、「度数」や「階級」について、私もちょっとモヤモヤしていましたので、調べておくことにしました。同じようなモヤモヤをお持ちの方はお付き合いください。

度数 frequency

まずは国語辞典を見てみましょう。

どすう【度数】①回数。②〔数〕(frequency)標本のとる値をいくつかの区間に分けたときの、各区間に属する標本の個数。頻度。③角度・温度などを表す数値。

広辞苑第六版より

「度数」は「回数」である!と最初に書かれています。だったら「回数」でいいんじゃね?「回数分布表」でいいんじゃね?とか思いますね。あらゆる統計学の教科書を書き直す気はないのでこれ以上主張しませんけど。

どすう【度数】①「回数」の意のやや古い表現。〔電話の通話料金を計算する基準としても用いられる〕②〔←頻度数〕〔統計学で〕数値データの集まりを数値の大きさを基準として幾つかの組に分けて並べた時、おのおのの組に属するデータの個数。③温度・角度・アルコールの含量(以下略)

新明解国語辞典第七版より

困ったときの新明解。そうですか。「やや古い表現」ですか。なるほど。そういえば「テレホンカード」には「50度数」みたいに書いてありました。最近は電話の回数なんか数えるのかなあ。何ギガ?は気にするだろうけど。
ところで、②の冒頭に〔←頻度数〕という注がありますね。この矢印は、「~の略」みたいな意味でつけられているそうです。
もともとの英語は「frequency」つまり「頻度」なので、「頻度」を表した数、頻度数、度数、となったのでしょうかねえ。
英語を調べてみると。

In statistics, the frequency (or absolute frequency) of an event i is the number n_{i} of times the observation has occurred/recorded in an experiment or study.[1]: 12–19  These frequencies are often depicted graphically or in tabular form.
統計学では、ある事象iの頻度(または絶対頻度)は、実験や研究でその観測が発生/記録された回数n_{i}となる[1]。 12-19 これらの頻度は、しばしばグラフや表形式で描かれる。(DeepLによる翻訳)

上記ページより

とても丁寧な説明だと、私は思います。
垂直とびの記録整理に戻ると、「25㎝以上30㎝未満」の範囲の成績が記録された「回数」を、その「階級」の「度数」というのです。
ややこしさが解消されたわけではないけれど、とりあえず納得。

階級 class

すでに気づいておられるとも思いますが、これまでの辞書的な説明の中に、「階級」という言い方は出てきません。振り返ってみると、

  • 広辞苑「度数」の説明では・・・「区間」

  • 新明解「度数」の説明では・・・「組」

  • Wikipedia 「frequency」では・・・「event」(事象)

さらにいくつか調べてみると、

  • 日本大百科全書の「度数分布」の説明では・・・「小範囲を階級といい、階級に属する資料の個数をその階級の度数という」

  • ブリタニカ国際大百科事典の「度数分布」の説明では・・・「区間のことを階級といい、」

このうち「事象」(「組」も?)は、カテゴリデータの各カテゴリに対する呼称として使われるので省くとして、一般的な用語としては「区間」や「範囲」が使われています。このほうがわかりやすいですね。
英語では class が使われるのですが、あまりにも意味が広いためか、「frequency」の説明に出てくる「class」にはリンクが貼られていません。日本語版Wikipediaにも、統計学の用語としての「階級」の項目はありません。

だったら「範囲」のほうがよかったのにね。
とも思うのですが、「範囲」という用語は、すでに「最大値と最小値の差」、つまり散布度の指標として使われています。
だったら「区間」にしてよ。
とも思うのですが、こちらも、母数の「区間推定」、95%「信頼区間」などで使われています。
残念ですね。全国の統計学の教科書をぜんぶ書き直してやるという野望(?)は実現しそうにありません。