見出し画像

Python2年生:11日目

今日は正規分布。
(アイキャッチは相変わらずwrtnの「SDXL_JP」に雑な指示を出して描いてもらいました。「標準偏差のイメージ画像を描いて」で出てきた4種類のうちの1つ。標準偏差とは…)

データのばらつきを数値で表す「分散」と「標準偏差」

平均値が同じになるデータが作ってあるので、それを入力してデータの平均値を出す。

散布図でデータが散らばっている様子を可視化する。


このデータ全体は平均値からどれだけ上下にばらついているかを1つの数値で表す。

どうするか→分散を使う。
各データの平均値の差を2乗する。

計算式は、
分散=(平均力の差)の2乗の合計/データの個数

(IDについてもでた。けど、全ての列データの分散を求めさせたのでそういうものらしい)

標準偏差→分散の値だと大きくなりすぎるから、2乗したものを平方根で元に戻す→分散の平方根で求められる

標準偏差の何が便利か(学生時代にはじめて標準偏差が導入されて、親がめちゃめちゃ怒ってたのを思い出したけど…。いまだになんで怒ってたのかわからんな)

どのくらいばらついているか
ある範囲にどのくらいデータがあるか(分布がある形をしている場合)
がわかるのが便利らしい。(ふーん??)

Aのデータは約68%が29.2〜70.8の範囲にあるという結果(ふーん????68%ってどこからでてきたん??)

ヒストグラムにして比較すると視覚的になった(が、68%ってどこからでてきたん??)

正規分布というものに関連があるらしいのだが(気にもなるのだが)いい時間になったので、今日は手を動かすのはここまで。
ちょっと先の方を読んでおいて、手を動かすのは明日にしておこう。


この記事が気に入ったらサポートをしてみませんか?