前記事から続けて、二項分布で考えてみましょう。二項分布で出てくる確率pは母比率と呼ばれます。母比率pをデータから統計的に推定することを考えましょう。必要な精度の話…
昨今の世相を反映してか、0か1か、あるいは0か100かという議論(往々にして口論)をよく目にするようになりました。ここでは0か1かに規格化して話をしますが、白か黒か、正か…
データの相関という言葉も頻繁に目にするようになった。 データ間の関連性を検証するときによく用いるのが相関係数(正確にはピアソンの積率相関係数 Pearson's product-mo…
統計的検定という結構難解な概念が日常に侵入したこの3年半。だた、大多数の人がそもそも定義すら理解していない状況は変わらない。ここでは統計学で仮説の確からしさを評…
Aegis in the Dark
2024年2月15日 22:52
前記事から続けて、二項分布で考えてみましょう。二項分布で出てくる確率pは母比率と呼ばれます。母比率pをデータから統計的に推定することを考えましょう。必要な精度の話をしたいので、区間推定を想定します。成功確率がpである試行をn回行うときに成功する回数をkとすると、前記事の通りkは二項分布に従います。二項分布のkの期待値E(k)と分散V(k)はそれぞれとなることを思い出しましょう。ここで、
2024年2月11日 00:48
昨今の世相を反映してか、0か1か、あるいは0か100かという議論(往々にして口論)をよく目にするようになりました。ここでは0か1かに規格化して話をしますが、白か黒か、正か負かでも基本的に同じ話です。細かいことを考えないと、0か1かと言われたらどちらも同様に確からしいと思いがちな人が多いようです。しかし、こういう2者択一の問題には、ひとつ明示的になっていない重要な数値が隠れています。それが2つの
2023年10月23日 16:14
データの相関という言葉も頻繁に目にするようになった。データ間の関連性を検証するときによく用いるのが相関係数(正確にはピアソンの積率相関係数 Pearson's product-moment correlation coefficient)という量だ。定義などはWikipediaに丸投げしよう。この統計量は、線型関係を持つ(つまり散布図にすると直線的関係を持つ)2つのデータ間の関連性の強さを
2023年10月20日 15:36
統計的検定という結構難解な概念が日常に侵入したこの3年半。だた、大多数の人がそもそも定義すら理解していない状況は変わらない。ここでは統計学で仮説の確からしさを評価するための方法である「検定」について、考え方に重点を置いて書いてみる。統計的検定のためにはまず、一つの仮説(仮説1としよう)を立てる。手元にデータがあるとき、仮説1が成り立って「いない」ときにそのデータが得られる確率を考える。つまり、