マガジンのカバー画像

高等学校における統計教育と情報教育を考える

31
初等中等教育における統計やデータサイエンスに関する、記事をまとめています。 統計学やPythonについて勉強していることや実践したことを気の向くままに記事を書いています。 統計教…
運営しているクリエイター

#表計算ソフト

【第23回】クロス集計-後編

【第23回】クロス集計-後編

今回もアンケート調査でよく用いられるクロス集計についてまとめます。
高等学校の情報Iの授業で扱いたい、集計に使う手法として下記3つを順に考えているという内容です。

表計算ソフトのCOUNTIFS関数・複合参照

表計算ソフトのピボットテーブル

Pandasのcrosstabメソッド

前回は1.の方法についてまとめました。
よろしければ、前回の記事をご覧ください。

今回は2.と3.についてま

もっとみる
【第22回】クロス集計-前編

【第22回】クロス集計-前編

今回はアンケート調査でよく用いられるクロス集計についてまとめます。
高等学校の情報Iの授業では、その意義の説明とともに、集計方法の実習をきちんと行いたいところです。
そこで悩むのが、集計に使う手法として何を選択するかです。次の3つが代表的なところです。

表計算ソフトのCOUNTIFS関数・複合参照

表計算ソフトのピボットテーブル

Pandasのcrosstabメソッド

正直に言うと、「どれ

もっとみる
【第21回】 z検定とt検定 まとめ

【第21回】 z検定とt検定 まとめ

ここまでの記事ではPythonを利用して母平均の検定(z検定・t検定)を行う方法をまとめてきました。
今回はこれまでの内容をまとめつつ、表計算ソフトを利用した方法について整理していきたいと思います。

表計算ソフトを使った方法もPythonを使った方法と同じように、多くの学びがあります。数学Iや情報Iの授業では、学習目標や生徒の習熟度に合わせてツールを選択し、仮説検定の考え方について学びを深められ

もっとみる
【第10回】相関関係-後編

【第10回】相関関係-後編

前回に引き続きまして、データの相関についての理解を深めていくような高校数学と高校情報の授業を考えていきたいと思います。

前回の復習前回の記事では相関係数の定義をしました。これまでに出てきた統計量を一度、文字式を使って整理しておきましょう。

2つの変量$${ x,\ y }$$の組からなる大きさ$${ n }$$のデータ

$$
(x_1, y_1),\ (x_2, y_2),\quad \cd

もっとみる
【第9回】相関関係-前編

【第9回】相関関係-前編

こんにちは、kenstyです。私は高等学校における統計・データ活用分野における数学と情報の関わりについて興味を持っています。
これまでに考えたことや実践したことを、昨年末から少しずつnoteで発信をしており、自分の中で良い刺激となっています。今回で10回目の投稿になりましたが、これからもマイペースで続けていこうと思っております。

今回と次回は相関関係について、その中でも特に導入部分(相関係数の定

もっとみる
【第8回】分散と標準偏差-後編

【第8回】分散と標準偏差-後編

前回に引き続き、分散と標準偏差についての記事を書いていきたいと思います。今回は標準偏差について少し掘り下げて考えていき、重回帰分析などで使われるデータの標準化について話をしてみたいと思います。
なお、今回の記事も「数学I」の授業においてコンピュータを活用して展開することを想定しながら書いてみました。

変量の変換前回記事で使った10名の数学の小テストのデータを使います。

まず、10名とも一律5点

もっとみる
【第7回】分散と標準偏差-前編

【第7回】分散と標準偏差-前編

高等学校における統計教育と情報教育の有機的なつながりを考えていくシリーズの7回目で、今回は分散と標準偏差についてです。
平成30年公示の高等学校学習指導要領でも引き続き、「数学I」で扱われる内容になります。

数学Iと情報Iの関係気になってくるのが、「数学I」と「情報I」の学習順序です。
「数学I」で分散・標準偏差や相関係数を教科書に沿って学び、「情報I」でコンピュータを利用してこれらの統計量を求

もっとみる
【第6回】箱ひげ図

【第6回】箱ひげ図

今回は箱ひげ図と、四分位範囲に基づいた外れ値についての記事を書いてみたいと思います。

準備Pythonの実行環境はGoogle Colaboratoryを使うことにします。
でーたかじり虫さんの記事がとても分かりやすく、参考にさせていただきました。ありがとうございます!

Google Colaboratoryのファイルを新規作成しましたら、まずは必要なライブラリの読込からです。
今回はNump

もっとみる
【第5回】四分位数-後編

【第5回】四分位数-後編

こんにちは。kenstyです。
前回に引き続き四分位数についてまとめていきたいと思います。
文部科学省の検定教科書の定義および表計算ソフトのQUARTILE.INC関数・QUARTILE.EXC関数で採用している定義を比較してまとめた記事です。

前回の復習前回は奇数個(9個)の数から成るデータについて四分位数を考えました。結果を再度まとめておきます。

偶数個の数から成るデータ今回は偶数個(8個

もっとみる
【第4回】四分位数-前編

【第4回】四分位数-前編

今回は四分位数について、記事を書きたいと思います。まずは、平成29年(2017年)公示の中学校学習指導要領の引用です。

上記の内容は、1つ前(平成20・21年改訂)の学習指導要領では、高等学校の「数学Ⅰ」で扱われていた内容で、このたびの改訂により中学校第2学年に移行されました。
文部科学省の検定教科書の定義に沿った四分位数の考え方はそれほど難しくはないのですが、問題は学習指導要領にも述べられてお

もっとみる
【第3回】平均値と中央値-後編

【第3回】平均値と中央値-後編

前回の記事に引き続き、都道府県別人口と面積のデータ分析を表計算ソフトを使って行います。

前回の復習平成27年(2015年)の都道府県別人口と面積のデータを使います。

人口 平均値:270万4144人 中央値(24位):168万8177人
面積 平均値:8042㎢  中央値(24位):6097㎢
でした。どちらも極端な値を持つデータにより、平均値が中央値と比べて高くなっていました。
今回はこれを

もっとみる
【第2回】平均値と中央値-前編

【第2回】平均値と中央値-前編

今回から、統計データの分析と活用についての記事を書いていきたいと思います。今回は、基本的な統計量である平均値と中央値についてです。

中学校までの学習内容平均値はデータを全て足した合計値をデータ数で割った値であり、中央値はデータを昇順あるいは降順に並べたときの中央の値(データ数が偶数の場合は中央の2個の数の平均をとった値)のことでした。
これらはデータの大まかな傾向を知るときに利用される値で代表値

もっとみる