Introdaction to Statistics(📕)
37.
・statistics 2type
┗記述統計:特徴量抽出
┗推測統計:予測 (部分→全体)
・most important tool:SD
・histogram
┗階級/階級値/度数/相対度数/累積度数
・mean
┗全dataの代表値
・median
┗全dataの真ん中
・variance
┗{(x1-x̄ )+(x2-x̄ )…}/n
・standard definition:dataがどれ程遠くまで拡がっているか
┗√{(x1-x̄ )+(x2-x̄ )…}/n
┗SD±1=月並み , SD±2=特殊(両側計5%)
・標準正規分布
┗平均値=0 , SD=1
┗Graphは0を中心に左右対称
┗SD1以内=相対度数0.6826 , SD2以内=相対度数0.9544
・標準正規分布→一般正規分布の求め方
┗一般正規分布data=σ(graphの広がり)*標準正規分布data+μ(中央0から横移動)
・一般正規分布→標準正規分布の求め方
┗z=(x-μ)/σ
・不確実な対象に対し、正規分布と見做せるならば、統計的推定が可能。
┗統計的推定:少数のdataから母集団を特定すること
・95%信頼区間:5%は外れるriskを腹に呑む
┗-1.96以上+1.96以下
・一般正規分布の95%信頼区間特定
┗-1.96≦ x ≧1.96 ←σを加えて、μを加える
┗-1.96 ≦ (x-μ)/σ ≧ 1.96
・95%信頼区間で進め、母集団が外れる数字だった場合は仮説を棄却。
┗これが仮設検定・区間検定
┗95%信頼区間とは、さまざまな観測値から同じ方法で区間推定すること。その内の95%は正しい母数を含んでいる、そういう区間。
=
・母集団の平均値:μ , 母集団の標準偏差:σ , 母集団の分散:σ2乗
・sample数が多いほど、統計的推定の精度が高まる。
┗n数からx̄ を作る場合、nが大きいほど、x̄ はμに近付く
┗世紀母集団では、x̄ を作っても分布は正規分布のまま。サイコロは違う
・x̄ を取り出したい場合、標準偏差σ×1/√n
┗SDの母集団より1/√n縮むため,
┗(μ-1.96σ/√n) ≦ x ≧ (μ+1.96σ/√n)
・本書の最終目標「正規分布だとわかるが、母平均も母分散もわからない時の推定」
・標本分散
┗二乗で負の数がない為、正規分布ではなくジェットコースター型
┗統計量Vはカイのニ乗分布する
┗x̄ のカイニ乗分布の場合、自由度は(n-1)
・t分布
┗式は省略
この記事が気に入ったらサポートをしてみませんか?