見出し画像

【第12回】記述統計学と推測統計学

高等学校教育における記述統計学と推測統計学の扱いについて一度整理してみたいと思い、記事を書くことにしました。
冒頭にこれらの統計学の分類について整理をし、高等学校の数学I・A・Bと情報Iがどのように関わりながら学びを深めていけるかを考えていきます。

記述統計学と推測統計学

それではまず、記述統計学と推測統計学についてまとめていきます。

記述統計学

記述統計学とは、観測して得られたデータを表やグラフに整理したり、平均や標準偏差などの統計量で要約したりして、データの特徴を把握するような学問です。これまでの記事で書いてきましたような、「都道府県別の人口と面積」のデータのように手持ちのデータを分析する手法が研究対象であるとも言えます。

母集団と標本

一方で「視聴率」の調査などでは一部の世帯を対象に調査を行ってそのデータの特徴を調べることで、本来の調査対象である全世帯における視聴率を推測しています。全世帯を調べるのが正確ですが、労力もコストもかかるため、現実的ではありません。そこで、ランダムに調査対象となる世帯を抽出し、抽出された世帯におけるデータを調べることで、全世帯における傾向を統計的に推測するといった手法をとっています。
この例における「全世帯」のような調査対象全体のことを母集団、「一部の調査対象の世帯」のような母集団から無作為に抽出したデータを標本といいます。

図1: 母集団と標本

推測統計学

推測統計学は、標本から母集団の性質を推測する学問です。標本という実際に観測して得られた手持ちのデータをもとに、その外のデータである母集団の特徴を分析する手法が研究対象であるといえます。後で少し詳しく書いていきますが、ここで行う「推測」は人間の勘ではなく、データで出現する値に対し、その出現する確率がどのような分布になっているのかに基づいて行われます。こうして統計学は確率論と結びついていきます。

まとめますと、母集団から抽出した標本を記述統計学の手法を用いて分析を行い、確率論をベースにして母集団の性質を推測していく手法を扱うのが推測統計学であると言えます。

確率と統計

ここで、確率と統計の関係についてもう少し丁寧にみていきましょう。

度数分布表における相対度数

サイコロを投げて出た目を記録する作業を100回繰り返します。
実際に投げてみる代わりに、Pythonを使って1から6までの整数の乱数を100個発生させた配列を生成し、配列の1~6の個数をそれぞれ数えるようなコードを書いて実行させてみました。

図2: サイコロを100回投げる

上の実行結果をもとに、全100回の作業でそれぞれの目が出た回数を度数分布表に整理してみます。このようなデータを分析する際によく用いられるのが、データの総数(この場合は100)に対するその階級の度数の割合である相対度数です。こちらも含めてまとめますと下のようになります。

図3: 度数分布表

統計的確率と数学的確率

それでは試行回数を増やしてみます。1000回,10000回,… ,1000000回投げたときの1の目の出る回数とその相対度数を調べてみます。
上のプログラムを修正して、次のようにして実行してみました。

図4: サイコロを投げる回数を増やして調べる

相対度数がおよそ0.1667に近づいて行っていることが分かります。これは試行回数を増やした時に相対度数が限りなく近づく値であり、これを1の目が出る統計的確率といいます。
一方で、数学の授業で学習する「起こりうるすべての場合の数に対する、事象Aが起こる場合の数の割合」を事象Aの起こる数学的確率といいます。こちらを定義する上で大事な前提だったのが、起こりうるすべての場合が「同様に確からしい」こと、すなわち、起こりうるすべての結果のどれが起こることも同じ程度に期待できることでした。これは理想的な状況を考えたモデルにおける確率と考えられますが、大数の法則と呼ばれる確率・統計における基本定理から統計的確率は数学的確率に限りなく近づくことが保証されています。

確率分布へ

母集団における度数分布では、各階級に相対度数が対応していました。
これと同様に、ある試行おいて、ある値とその値が出現する確率を対応させたものが確率分布です。
上の例で、サイコロの目を$${ X }$$としたときに、確率分布を表にまとめると次のようになります。

図5: 確率分布表

この$${ X }$$のように試行によって起こる結果に対応した値を取る変数であり、その値をとる確率が対応付けられているものを確率変数といいます。

推測統計学は観測により得られたデータから確率分布を推定し、推定された確率分布から手持ちのデータの外のデータを推測していくのが基本的な流れであると言い換えられます。

ここまでのことを簡単にまとめます。
相対度数は、調査対象全体に対する特定の値の出現回数の割合を求めたもので、手持ちのデータの傾向を分析しているものと言えます。一方で確率は、その調査対象から限りなく多くの回数を無作為抽出したときに特定の値が出現する頻度であり、これから起こることを予測しているものとも言えます。
やや不正確な表現ではありますが、「度数分布における階級(または階級値)と相対度数の対応」の極限が「確率分布における確率変数と確率の対応」であるというようなイメージで捉えています。

高等学校学習指導要領での扱い

高等学校における統計・データ分析に関する学習内容を整理すると下の図のようになります。青が記述統計学、赤が推測統計学、黄が確率論、緑が機械学習の領域を表しております(おおよその分類)。

図6: 数学I・A・Bと情報I・IIにおける統計・データ分析
(高等学校学習指導要領解説をもとにkensty作成)

数学だけ見ますと、「数学I」で記述統計学を中心に学び、「数学A」で場合の数と確率を学んだ後に、「数学B」で推測統計学を学ぶというのが統計分野の大きな流れです。
ここで注目したいのは、平成30年告示の学習指導要領から数学Iの学習内容として加わった「仮説検定の考え方」です。

数学I「仮説検定の考え方」

数学Iの「データの分析」中に推測統計学のメインテーマの1つである仮説検定が入ってきているのは、学習の系統性の観点からは違和感があります。また、確率分布をまだ本格的に学んでいない状態で仮説検定の考え方を学ぶことの意義は何なのでしょうか。
下記の高等学校学習指導要領解説における仮説検定に関する記載の引用から考えてみたいと思います。

(ア) 数学I
(中略)
仮説検定については「数学 B」の「統計的な推測」で取り扱うが,この科目の履修だけで高等学校数学の履修を終える生徒もいることから,実際的な場面を考慮し,具体例を通して「仮説検定の考え方」を直観的に捉えさせるようにした。

高等学校学習指導要領(平成30年告示)解説 数学編 理数編 p.11

ここでは高等学校の「必履修科目」において、「仮説検定の考え方」を学ぶことの意義が述べられています。私もその意義については同意します。仮説検定は、データを批判的に捉え、仮説を立てて検証を行い、何らかの論拠に基づいて判断をする力が求められるからです。このような力は、高等学校における探究的な学びの基盤となると考えられることから、カリキュラム全体を通して学びをより深めていくという観点からも、すべての生徒がそれを学ぶこと意義は大きいと感じます。

一方で、数学の学習内容だけに注目すれば、数学Iのデータの分析の単元として、仮説検定の考え方を学ぶことは何だか唐突な気もします。そこで、考えたいのは情報Iの授業との関係です。

情報Iとの関係

学習指導要領解説の中でも強調されていますが、数学Iの「データの分析」および数学Aの「場合の数と確率」は情報Iの「情報通信ネットワークとデータの活用」と関係が深く、両科目が連携をしながら学びを深めていくことが前提であるとも言えます。少し大胆なことを言えば、情報Iの授業において、コンピュータを活用してデータを分析しながら、記述統計学と推測統計学をつなぐ役割を果たせたら面白いと思います。
私の過去の記事で大変恐縮ですが、第9~10回は手持ちのデータを分析して相関分析を行い、その知識と表計算ソフトの機能をもとに、第11回では単回帰分析に自然とつなげて、未知のデータ予測を行いました。前者は記述統計学の領域であり、後者は推測統計学なのですが、このことは通常あまり意識されません。

問題提起

私見ですが、単回帰分析と同様に仮説検定の考え方は数学Iの授業の中ではなく、情報Iの授業の中で導入を行う方が自然であると考えました。
モデル化を行い、そのシミュレーションをプログラミングを活用して実施する活動を通して、確率分布の考え方を理解しやすくなることが期待できます。そして確率分布を表すグラフを描画することや、p値など検定に必要な統計量を求めることも難しくなく、仮説検定の一連の流れを実際にコンピュータを活用しながら経験し、学んでいけると思われます。「具体例を通して直感的に捉える」という意味では、このような情報Iからのアプローチも興味深いと考え、問題提起をしてみました。

まとめ

今回は記述統計学と推測統計学という統計学の分類の観点から、高等学校の各科目における統計分野の学びについて考えてみました。
記述統計学を中心に扱う「数学I」と推測統計学を中心に扱う「数学B」を、「情報I」でつなぐという内容であり、大きいテーマであったために私自身もまだ消化不良の部分が多くあります。今回整理したことをもとに、今後もさらに研究を進めて参ります。

次回以降、情報Iの授業で仮説検定の考え方を学んでいくような記事をまとめていきたいと考えています。
最後までお読みいただきありがとうございました。