Introdaction to Statistics(📕)

37.

・statistics 2type
 ┗記述統計:特徴量抽出
 ┗推測統計:予測 (部分→全体)

・most important tool:SD

・histogram
 ┗階級/階級値/度数/相対度数/累積度数

・mean
 ┗全dataの代表値

・median
 ┗全dataの真ん中

・variance
 ┗{(x1-x̄ )+(x2-x̄ )…}/n

・standard definition:dataがどれ程遠くまで拡がっているか
 ┗√{(x1-x̄ )+(x2-x̄ )…}/n
 ┗SD±1=月並み , SD±2=特殊(両側計5%)

・標準正規分布
 ┗平均値=0 , SD=1
 ┗Graphは0を中心に左右対称
 ┗SD1以内=相対度数0.6826 , SD2以内=相対度数0.9544

・標準正規分布→一般正規分布の求め方
 ┗一般正規分布data=σ(graphの広がり)*標準正規分布data+μ(中央0から横移動)

・一般正規分布→標準正規分布の求め方
 ┗z=(x-μ)/σ

・不確実な対象に対し、正規分布と見做せるならば、統計的推定が可能。
 ┗統計的推定:少数のdataから母集団を特定すること

・95%信頼区間:5%は外れるriskを腹に呑む
  ┗-1.96以上+1.96以下

・一般正規分布の95%信頼区間特定
 ┗-1.96≦ x ≧1.96 ←σを加えて、μを加える
 ┗-1.96 ≦ (x-μ)/σ ≧ 1.96

・95%信頼区間で進め、母集団が外れる数字だった場合は仮説を棄却。
 ┗これが仮設検定・区間検定
 ┗95%信頼区間とは、さまざまな観測値から同じ方法で区間推定すること。その内の95%は正しい母数を含んでいる、そういう区間。

=

・母集団の平均値:μ , 母集団の標準偏差:σ , 母集団の分散:σ2乗

・sample数が多いほど、統計的推定の精度が高まる。
 ┗n数からx̄  を作る場合、nが大きいほど、x̄  はμに近付く
 ┗世紀母集団では、x̄  を作っても分布は正規分布のまま。サイコロは違う

・x̄  を取り出したい場合、標準偏差σ×1/√n
 ┗SDの母集団より1/√n縮むため, 
 ┗(μ-1.96σ/√n) ≦ x ≧ (μ+1.96σ/√n)

・本書の最終目標「正規分布だとわかるが、母平均も母分散もわからない時の推定」

・標本分散
 ┗二乗で負の数がない為、正規分布ではなくジェットコースター型
 ┗統計量Vはカイのニ乗分布する
 ┗x̄  のカイニ乗分布の場合、自由度は(n-1)

・t分布
 ┗式は省略

この記事が気に入ったらサポートをしてみませんか?