『高校数学のロードマップ』A_6(確率編)1『統計』

(2019/11/27差し替え)

(※注:「理系に進学したいが数学が苦手な知人の高校生に、数学の良さを教える」というミッションのための草稿を、あらかじめWebに掲載して、ダメなところを指摘してもらおう、という趣旨の記事です)

***

〇統計

●確率から物理学までのロードマップと重要な中間生成物

・さて、高校数学の理論面での最後の一里塚である確率から、理科、正しくは自然科学(しぜんかがく)の基礎であり代表である物理学(ぶつりがく)までの、ロードマップが存在します。
だいたい

確率→統計→物理学

というロードマップだと思ってください。(これは数学の教材なので、理科に関しては説明しません。ご了承下さい。)

●どうもリアリティに乏しい数学をリアルな世界の科学的な理解のために使いたい

・今までの数学の話は、何によって正しさが保証されるかというと、「このようなものがあると定義して、こういう法則に従うとして、どういうものが出来るか」という、論理学に基づく論理的な正しさによって保証されています。
(実はこの話はB参考編の中のI.集合編の集合の章と演算の章でかなりページを割いたのですが、本文ではほとんど説明していないので、B参考編を読んでいない場合は「そうなんだ」程度に思っていただければ結構です。)
「えっ!? リンゴとかの数を数えるんじゃないの!?」と誰しもまずは思うところですが、自然界における物が数学を保証しているという考え方は、一般に採用されていません。
実際の数や図形ではない、抽象的な数や図形等を扱うときに、この説明だとかなり面倒な話になるからです。
・それに、今までの数学の教材の説明に、物理学から持ってきたキーワードがなかったのは、それらを使ってもまるで数学の説明に向かないからです。
逆に、物理学では数学を様々な形で使います。
なので、素直に、「数学が物理学のさまざまな性質を支えているのであって、逆ではない」という解釈で行きます。この関係は覚えておきましょう。


・さて、こうなると不安になってくることがあります。
 「数学は、自然界と関係なく、論理学から作られたのか? じゃあ、数学って、物理学とかの自然科学、つまりは自然界の説明に、どこまで役立つのか?」という不安です。
・この不安を解消するには、「実際に使えるし、ものすごく便利である」ことを見て行けば良いのではないか。
ということですので、「自然科学では一般にどのようなことを行っているか」「そしてそのために数学はどういう応用が出来るか」ということを説明します。

●統計を扱うジャンル・統計学

・このような数学の応用の一つで、非常に重要なものが、統計学(とうけいがく)です。
何らかの具体的なデータを大量に集めて、何らかのパターンを見つけたい、という数学のジャンルを、統計学と呼びます。
統計学では統計(とうけい)を扱います。統計とは、何らかのパターンを見つけるために集めた、たくさんのデータと、そこから何らかのパターンを見つけるための一連の操作のことです。
・統計学は、実際の自然科学でバリバリ使う、技術としての数学です。そういう意味では実用性があります。
統計学の実用性は何が支えているかというと、実は確率論なのです。確率論をうまく使うと、実はなんらかのパターンが分かるのです。

●相関関係と因果関係

・統計学について簡単に説明しますと、
「データを集計する」→
「データを比較する」→
「相関関係を通じて因果関係を解析する」→
「何らかの用途に役立てる(いろいろな段階がある)」
となっております。

・確率論を使うと、なんと出来事の相関関係(そうかんかんけい)、さらには因果関係(いんがかんけい)を探ることが出来ます。
 相関関係とは
「あれとあれには関係がある」
 というやつです。
 因果関係とは、相関関係の一種で、
「あれとあれをやったらこれになる」
というやつです。
・さっきのロードマップですが、より詳細には

確率→統計→(相関関係→因果関係→)物理学

 となります。

たくさんデータがあると、「他の条件がほぼ一致して、特定の条件だけが違う、2つのグループ」を作って比較することができます。この2グループの間で、調べたい値が違っていたら、その特定の条件と調べたい値の間には、相関関係(そうかんかんけい)があります。これは非常に重要なパターンです。
 要するに、特定の条件が増えたら、調べたい値が増えるか減るかしているとなると、その特定の条件と、調べたい値が表す、自然界の2つの性質の間には、何らかの関係があり得ると考えるのです。
・ただし、この時点では「どちらが原因でありどちらが結果であるか」はもちろん分かりません。原因と結果をひっくり返して説明することが出来てしまいます。これでは困ります。
それどころか、「条件xと結果yの間には共通の原因zがあり、zの影響でxとyの両方が変動しているから、一見xとyの間に因果関係があるように見えるだけであり、実際には因果関係などない」ということがしょっちゅうあり得ます。困りますね。

・ということで、相関関係のうち因果関係だけが欲しい。というニーズがあります。
 非常に率直に考えると、「a,b,…,x,yをしたらzになったが、zをしたからといってa,b,…,x,yになるとは限らない」とき、a,b,…,x,yは原因、zは結果ということになります。
(本当はもうちょっと細かい話があるのですが、説明しません。)
この操作を入れることで、普通の相関関係から因果関係だけを選別できます。

・物などの自然界についての説明である自然科学においては、デタラメな説明とそうでない説明を分けるものはいくつかあります。特に「因果関係が本当にあるかどうか」ということは非常に重要です。
逆に、これがない説明は、基本的におまじないと区別できなくなります。
・「原因をやったら結果が出来る」という話は、他の条件が整っていて、また阻害要因が整っていなければ、普通は成り立ちます。統計学や自然科学が要求している因果関係は、基本的にはこのレベルの話です。
・そして、「結果をやったら原因が出来る」という話は、普通は成り立ちません。
もちろんそのような相互作用が起きる場合はないわけではありませんが、それらにはたいていはちゃんとした理由があります。(理由については、長くなるのと、面倒なので、説明しません。)
それら以外の場合は、ただの偶然になります。偶然のような、非常に弱い影響力しか持てないものを、自然法則としては採用できません。
・「あれとあれをやってもこれにならない」
とか、
「逆に、これをやったらあれとあれになるかと思ったが、そうはならなかった」
とか、そういうことが分かっていると、無駄な投資や努力をしなくて済むし、その投資や努力を別のもっと効果のあることに使えるので、因果関係が分かっていることは非常に重要です。

●自然科学の心得

・小中高校だと理科でやるような、自然科学があります。
自然科学においては、きちんと証拠を押さえていない理論は、実証できていない、あるいは実証できない、ただの空理空論です。そういったものを自然科学として採用できません。
そんな空理空論で、物などの自然界の説明をしても、正確になる訳がありません。そんなものは偶然でしかない。
実際に物などの自然界が、空理空論と違う現象を示したら、それは物などの自然界が文句なしに正しいし、空理空論は間違っている。(偶然等の話は排除できませんが、自然法則の結果か偶然の産物かは、これも統計で見極められることです。)
そして、自然科学が空理空論と区別されるためには、実際の自然界の因果関係などのパターンを正確に反映していなければならない。


・しかも、自然法則は、「特定の条件下であれば、いつでも、どこでも、偶然を除いて、正しい」というレベルが期待されています。「いつでも、どこでも、偶然を除いて」というからには、一回きりの証拠では、自然法則であると言うことはできない。むしろ、一回きりの証拠が、単に偶然の産物かもしれないからです。その他の場合、普通は失敗する、というのだったら、それは困る。
これは十回でも百回でも同じことで、全体が一億回の中で、百回あったとしたら、よほど特殊な条件でのみ成り立つ自然法則であるか、もしくはやはり偶然であるか、という見極めを迫られることになります。(前者の可能性も否定できないので、非常に慎重にならねばなりません。)
こういうときに正に統計学が必要になってきます。


・物などの自然界の現象や運動のデータを、1データだけではパターンがわかりにくいから、パターンがちゃんと出るように、大量に集めて、パターンを見つけたい。そうすればそれは、非常に確実な自然科学になります。
また、データを生み出し、そこからパターンを見つけることができます。こうなると統計は非常に便利になります。生み出されたデータは、何度やっても同じ確率で同じことが起きる水準での再現性が欲しい。このために厳密な実験の作法があります。
逆に、統計や実験で確認出来ないことを自然科学と呼んではいけません。物などの自然界の現象や運動のデータを使って確認できないのに、あるいは統計できるほどのデータもないのに、「特定の条件下であれば、いつでも、どこでも、偶然を除いて、正しい」と言い張るようなものは、空理空論であり、自然科学と言わないというのが、自然科学の中での共通見解であるはずです。
(今までの統計や実験から新しく生み出された理論の中には、今まで分かっているデータとは別の未知の帰結が予想されて、それらの統計や実験がまだされてないこともよくあります。しかし、それらもいつかはたくさん統計や実験がされねばなりません。そこからは逃れられません。)
(また、進化論などのある種の生物学は、再現性がないため、実験出来ないと考えられています。それでも、それに関するデータはたくさんあり、統計にかけることももちろん出来るので、ここから理論を生み出すことは出来ます。)
・そういうわけで、統計学は、物理学を含む自然科学の、非常に重要な基礎です。大学ではしっかり身につけていきましょう。



この記事が参加している募集

数学がすき

応援下さいまして、誠に有難うございます! 皆様のご厚志・ご祝儀は、新しい記事や自作wikiや自作小説用のための、科学啓蒙書などの資料を購入する際に、大事に使わせて頂きます。