Introdaction to Statistics(📕)

2021年12月21日 16:36

37.

・statistics 2type
　┗記述統計：特徴量抽出
　┗推測統計：予測　（部分→全体）

・most important tool：SD

・histogram
　┗階級/階級値/度数/相対度数/累積度数

・mean
　┗全dataの代表値

・median
　┗全dataの真ん中

・variance
　┗{(x1-x̄ )+(x2-x̄ )…}/n

・standard definition：dataがどれ程遠くまで拡がっているか
　┗√{(x1-x̄ )+(x2-x̄ )…}/n
　┗SD±1=月並み , SD±2=特殊(両側計5%)

・標準正規分布
　┗平均値=0 , SD=1
　┗Graphは0を中心に左右対称
　┗SD1以内=相対度数0.6826 , SD2以内=相対度数0.9544

・標準正規分布→一般正規分布の求め方
　┗一般正規分布data=σ(graphの広がり)*標準正規分布data+μ(中央0から横移動)

・一般正規分布→標準正規分布の求め方
　┗z=(x-μ)/σ

・不確実な対象に対し、正規分布と見做せるならば、統計的推定が可能。
　┗統計的推定：少数のdataから母集団を特定すること

・95%信頼区間：5％は外れるriskを腹に呑む
　　┗-1.96以上+1.96以下

・一般正規分布の95％信頼区間特定
　┗-1.96≦ x ≧1.96　←σを加えて、μを加える
　┗-1.96 ≦ (x-μ)/σ ≧ 1.96

・95%信頼区間で進め、母集団が外れる数字だった場合は仮説を棄却。
　┗これが仮設検定・区間検定
　┗95%信頼区間とは、さまざまな観測値から同じ方法で区間推定すること。その内の95%は正しい母数を含んでいる、そういう区間。

・母集団の平均値：μ , 母集団の標準偏差：σ , 母集団の分散：σ2乗

・sample数が多いほど、統計的推定の精度が高まる。
　┗n数からx̄ を作る場合、nが大きいほど、x̄ はμに近付く
　┗世紀母集団では、x̄ を作っても分布は正規分布のまま。サイコロは違う

・x̄ を取り出したい場合、標準偏差σ×1/√n
　┗SDの母集団より1/√n縮むため,
　┗(μ-1.96σ/√n) ≦ x ≧ (μ+1.96σ/√n)

・本書の最終目標「正規分布だとわかるが、母平均も母分散もわからない時の推定」

・標本分散
　┗二乗で負の数がない為、正規分布ではなくジェットコースター型
　┗統計量Vはカイのニ乗分布する
　┗x̄ のカイニ乗分布の場合、自由度は(n-1)

・t分布
　┗式は省略

この記事が気に入ったらサポートをしてみませんか？