統計学：データの不確実性

2022年8月8日 19:39

統計は、データを使用して周囲の世界に関する質問に答えることができる強力なツール。サンプルを集める際、「サンプルの正確性」というも問題に当たる。この問題を理解するには、データの不確実性と確立について理解する必要がある。

何かが起こる可能性を考えるときはいつでも、私たちはチャンスについて考える。確率は、私たちがチャンスを定量化して研究することを可能にする数学の分野。

確率は、イベントに0から1までの数値を割り当て、イベントが発生する可能性を示す。確率0は、イベントが不可能で発生しないことを意味し、確率1は、イベントが確実に発生することを意味する。

確率の表記

確率について書くときは、文章を簡潔にするために、通常、イベントを大文字で表す。大文字のPを使用して確率を示し、イベントの確率をP（event）と表記する。

確率は、データ内の不確実性を定量化する方法を提供するため、統計にとって重要。次に、確率は実験的に推定できる。このような確率を実験的確率と呼ぶ。

イベントの理論上の確率を計算するには、最初に、実験のすべての可能な結果、または変数が取る可能性のある値を知る必要がある。
実験のすべての可能な結果、または変数が取ることができる値のセットは、サンプル空間と呼ばれる。

実験の各結果が同じように発生する可能性がある場合、イベントが発生する確率は、イベントに含まれる結果の数を実験の結果の総数で割ることによって計算できる。

確率の法則と呼ばれるいくつかのルールがあり、より複雑な確率を計算するために使用できる。より複雑な確率を計算するには、より単純なイベントからより複雑なイベントを構築できる必要がある。

AとBの2つのイベントがあるとします。これらの2つのイベントから、次のものを作成できる。

・イベント「AとB」、別名A∩B：AとBの両方が発生するイベント
・イベント「AまたはB」、A∪Bとも表記：Aが発生するか、Bが発生するか、またはAとBの両方が発生するイベント
・イベント「notA」、A'とも表記：Aが発生せず、A補集合と呼ばれることもあるイベント。

確率の法則は、より複雑なイベントの確率を計算するための便利なツール。まず、独立。

2つのイベント、AとBは、一方のイベントが発生する確率がもう一方のイベントが発生するかどうかに影響されない場合、互いに独立している。

イベントが互いに独立していない場合、イベントは互いに依存している。独立したイベントの場合、イベントAとBの両方が発生する確率は、イベントAが発生する確率にイベントBが発生する確率を掛けたものに等しくなります。

P（AおよびB）= P（A∩B）= P（A ）×P（B）

私たちはしばしばイベントA'（「Aではない」）をAの補足と呼ぶ。

これは時々Acと書かれる。
Aが発生する確率は、1からイベントAが発生しない確率を引いたものに等しくなる。

P（A）= 1-P（A'）

ベン図は、19世紀後半に英国の哲学者ジョン・ベンによって論理理論でステートメントを表現する方法として導入された。今日では単純な比率または確率を表す一般的な方法として認知されている。

AとBの2つのイベントがあるときはいつでも、確率P（A）、P（B）、を示すベン図を作成できる。
およびP（AおよびB）（または同等にP（A∩B））：左側の完全な円はP（A）を表し、右側の完全な円はP（B）を表し、オーバーラップはP（A）を表します。およびB）

同様に、確率P（AがBではない）、または同等にP（A∩B'）を、右側の円の内側にもない左側の円の部分と、確率P（左側の円の内側にもない右側の円の部分による、A）ではなくB）、または同等にP（B∩A'）。

条件付き確率とは、他のイベントが発生した場合、または発生した場合に、イベントが発生する確率のこと。

イベントAとイベントBが与えられた場合、Bがすでに発生していると仮定して、Aが発生する確率をP（A | B）と書く。条件付き確率は、相互に依存している複数のイベントに関係する確率を調べるときに非常に重要。

AとBが独立していないとどうなるか？

Payal：イベントAとBが相互に依存している場合、P（AとB）= P（A∩B）= P（A | B）×P（B）。

最後に、P（AおよびB）= P（BおよびA）であるため、これは次のことを意味する。

P（A | B）×P（B）= P（B | A）×P（A）

この公式はベイズの定理として知られている。