【統計検定2級⑤】データの活用

みなさん、こんばんわるいーじ!

なぞのハイテンション失礼しました。別になにか特別いいことがあったわけではありません。

今回学んでいく内容は「データの活用」です。ここからは高校ではみることのなかったより深いデータ分析の仕方・見方を学びます。よくデータサイエンスなどで使う最小二乗法だったり、決定係数R-squaredだったりを見てきます。なんか、ムズカシそう(実際、理論のお話だとめちゃくちゃ∑が出てきたりします)。。。。でも、大丈夫!内容は高校数学がわかっていれば、多分OK!また、今回の範囲は、イメージ的理解こそが鍵となります。なので、今回の資料はビジュアルに特化した感じの記事を添付してきます。それでもわからない場合はyoutubeなどで見ると理解できると思います。おなじみヨビノリさんとか、統計検定に関しては、「塾講師オザワのていねいな授業」さんが個人的にわかりやすかったです。

では、張り切っていきましょう!!!

・最小二乗法、変動の分解、決定係数、回帰係数、分散分析表、観測地と予測値、残差プロット、標準誤差、変数変換

最小二乗法

変動の分解(結構大変かも。。。)

決定係数

回帰係数

分散分析表

観測地と予測値、残差プロット

標準誤差

変数変換(統計検定2級における変数変換とは、おそらく「平均値と標準偏差の変数変換」みたいなものを指していると思います。各々のデータの基準を一定にするために変数を変換しようといった類。)

・成長率、指数化、幾何平均、系列相関・コレログラム、トレンド、平滑化(移動平均)

成長率(何の成長率か判然としないため、題材が正しいか不安。)

指数化(指数対数の指数ではないので注意!この記事の「変化率」が「成長率」説〜〜??)

幾何平均

系列相関・コレログラム(コレログラムは過去門でも結構でてた印象ある)

トレンド(時系列データ(株とか)の長期的変動のこと。)

平滑化(移動平均)(概要と計算方法だけでOK!)


お疲れ様でした。今回の内容は大変ボリューミーでしたね〜。ちなみに今回習った範囲は実用的なデータ分析では頻出です。データ分析でこれらの知識を用いるときは、基本excelやpython,R,C++などの数理処理に長けたツールを使います。そうすると、データ数の多い場合でも、1秒もかからずに計算結果をだしてくれます(さすが文明の力)。

統計検定におけるこの手の出題方法は、データ数をめちゃくちゃ小さくして計算させるか、グラフから読み取る系の出題になるのではと思います。なので、イメージを大事にして、演習を行ってみてください!!

ご拝読ありがとうございました。それでは、また明日!

今回利用した記事一覧


この記事が気に入ったらサポートをしてみませんか?