マガジンのカバー画像

斜め45°から観る初心者統計学

13
なぜ「斜め45°」か?それは、統計学を可視化すると、やたらと45°の平面とか直線が出てくるからです。  さあ、統計学はとっつきにくい。何がとっつきにくいって、言葉が難しいし、根拠…
運営しているクリエイター

記事一覧

【統計学】確率変数の再生性の直感的把握1:畳み込みの本質

【統計学】確率変数の再生性の直感的把握1:畳み込みの本質

本稿の目的 それぞれ正規分布$${N(\mu_X,\sigma_X^2),N(\mu_Y,\sigma_Y^2)}$$に従う確率変数$${X,Y}$$の和$${Z=X+Y}$$を新たな確率変数とした場合、その分布はやはり正規分布で、その平均と分散は両者の和となる。
 $${Z \sim N(\mu_Z,\sigma_Z^2)=N(\mu_X+\mu_Y,\sigma_X^2+\sigma_Y^2)

もっとみる
【統計学】データと平均と偏差の(直角)三角関係【その1 単純平均(等確率)編】

【統計学】データと平均と偏差の(直角)三角関係【その1 単純平均(等確率)編】

 三角関係といってもややこしいアレではありません。文字通りの三角関係、それも直角三角関係です。
 当塾の統計学の視覚化は、ここから始まりました。

分散早業公式(仮称) 正式名称が見当たらなかったので仮称ですが、高校生も習う例の分散をやや速く計算できる「分散早業公式」があります。
 「分散は二乗の平均マイナス平均の二乗」というアレです。

$$
s^2 = \dfrac{1}{n}\sum_{i=

もっとみる
【統計学】観測値・平均・偏差、実は直角三角関係【その2 】

【統計学】観測値・平均・偏差、実は直角三角関係【その2 】

今回のあらすじ全ての確率が等しい訳ではない場合での観測値・平均・偏差の直角三角関係を示したい。

名前がないと不便なので、全ての確率が等しい場面を「均質確率空間」、それ以外を「不均質確率空間」と名づける。前回は、均質確率空間での直角三角関係を示したことになる。

不均質確率空間でも分散早業公式は成り立つが、そのままでは直角三角関係を示せない。

仕方ないので確率の平方根「根確率」や「加重観測値」を

もっとみる
確率変数の「和」「再生性」からの「畳み込み」、よく分からないお友達集まれ その1

確率変数の「和」「再生性」からの「畳み込み」、よく分からないお友達集まれ その1

 皆さんよくお集まりで。

よく分からない原因(推測)「再生性」という用語は少し分かりにくい

 いきなり本題ですが、確率変数に再生性があると言っても標準正規分布-2$${\sigma}$$より左の端っこが齧られてなくなってもまた生えてくるという話、では全くないことは薄々気付いておられたことでしょう。

 ふざけている訳ではありません。「分布の再生性」は、英語の reproductive prop

もっとみる
かなり雑だがまあまあ短い、二項分布の極限が正規分布になる証明

かなり雑だがまあまあ短い、二項分布の極限が正規分布になる証明

 統計学の始めの方で必ず、「二項分布のnを無限まで飛ばすと正規分布になります」という説明があります。
 確かに、絵で見ると、一目瞭然です。

 しかし、離散的(飛び飛びの値を取る)な二項分布の式と、連続的な正規分布の式は、似ても似つかないものです。

$$
f(k)=\dfrac{n!}{k!(n-k)!}p^k(1-p)^{n-k}  <二項分布>
$$

$$
f(x)=\dfrac{1}{\

もっとみる

セル看護提供方式®による転倒・転落防止効果の検証

セル看護提供方式®とはセル看護提供方式®の定義は、以下の内容です。

 今回、セル看護提供方式®の転倒・転落防止効果を検証するため、介入前期間と介入後期間でで得られたデータの検定を行いました。

結果データ共通項目

時間帯:日勤帯(8:30〜17:00)
対象:65歳以上の入院患者
期間:介入前:2019年度、介入後:2020年度

月別データ

データの要約

介入前 転倒転落数170 なし

もっとみる
【統計学】標本の大きさ(サンプルサイズ)の決め方のまとめ

【統計学】標本の大きさ(サンプルサイズ)の決め方のまとめ

 授業での質問:「母集団に対していくつ標本を取れば十分なのかがよくわかりません。どうやって決めるんですか」。

 実務上大事な論点です。
 改めて調べてみると、結論としては主に2通りの決め方があるようです。

許容誤差から逆算

検出力から逆算

用語確認「標本数」と「標本の大きさ」

 「大きさって何、採取した物の大小?」と思っても仕方がないと思います。
 一般的な感覚とズレる統計用語の代表かな

もっとみる
【統計学】仮説検定の基本中の基本

【統計学】仮説検定の基本中の基本

 統計学の仮説検定を勉強すると、帰無仮説・対立仮説、z検定・t検定・母比率検定、母平均・母分散が既知・未知、等しい・等しくない、そして2標本問題の対応のある・なし、とまあ初心者が迷子になるようにしているのかと疑ってしまうような、初学者の行手を阻むような語感の用語と大技が次々と繰り出されて来ます。統計学に通じている人には当たり前の事なのでしょうけど、初心者からすると慣れない数式の上に聞いたこともない

もっとみる
【統計学】カイ二乗分布。なぜこんな形?手作業でやってみた。

【統計学】カイ二乗分布。なぜこんな形?手作業でやってみた。

 この説明に「こんなグラフになります」と見せて、平均が自由度と一致、分散は自由度の2倍。これで大概の教科書のカイ二乗分布の説明は終わり。

 ふーん、そうなるのか。なるほど。山が低くなりつつ右に移動するのね…

 ちょっと待て。

 …皆さん、どうしてこんな形になるのか、納得していますか?
 少なくとも私は、この説明だけでは全く分かりません(でした)。
 $${X^2}$$の確率密度?普通$${X

もっとみる
【統計学】正規分布はサイコロ(の断面)〜二次関数と三次関数による正規分布の近似

【統計学】正規分布はサイコロ(の断面)〜二次関数と三次関数による正規分布の近似

要約正規分布は、サイコロ(立方体・超立方体)を偏差平面($${x_1+x_2+ \cdots +x_n =k}$$)でスライスした時の断面上の格子点数の函数グラフとほぼ一致した。当然か。2回勝負より3回勝負の方がより一致したので間違いないと思われる。
 両者は無限次元の超立方体で一致すると思われるが難しくて先送り。

発想 統計学の解説書等では「二項分布は極限で正規分布に一致し、その証明はスターリ

もっとみる
【視覚化】ベクトルの内積

【視覚化】ベクトルの内積

 統計学基礎を一般の人に教えるにあたり、どうしても高校程度の数学が必要になるのですが、数式を見るだけでケロケロとなる人の気持ちも分からんでもない。
 なんとかならないものか。
 統計学の視覚化には、ベクトルを含む線形代数が最適。よし、この際、線形代数の基本の視覚化に挑戦し、数学的にも正しく、ごまかさず、かつ難しくないように工夫してみようと思ったのが地獄の始まりでした。
 ネットを調べてみても、「一

もっとみる
【導出】大数の法則

【導出】大数の法則

 サイコロを振れば振るほど、出目の平均は3.5に近づいていく。
 感覚的にはそりゃそうだ、と。大数の法則と呼ぶらしい。
 しかし、これは数学的にはどうなっているのか調べてみると、こんな式らしいです。強い法則と弱い法則があるのですが、今回は弱法則です。

$$
P(|\bar{X_n}-\mu|\ \geq \epsilon) \leq \lim_{n \to \infty}\dfrac{\sigm

もっとみる
ヒストグラムの階級数の目安はスタージェスの公式で

ヒストグラムの階級数の目安はスタージェスの公式で

 データをヒストグラムでいい具合に表現したいが、分け方が雑だと何のこっちゃよく分からん。細かすぎると凸凹してやはりよく分からん。いい具合の分け方はないものだろうか。

 そんなお悩みを解決するのが、スタージェスの公式というやつです。

スタージェスの公式とは

 階級数を$${k}$$、データ数を$${n}$$とすると、これでおおよそいい感じの階級数を割り出すことができます。

$$
k=1+\l

もっとみる