世の中に意外と多い分布(べき分布)
よく出てくる、正規分布
統計とかデータについて学ぶ時に、まず思い浮かぶのが「正規分布」でしょう。
学校の授業で、たぶん多くの人が「正規分布」を学んだと思います。
こういう分布のやつです。
フリーハンドで描いたので歪なグラフになってしまったことは、許してください笑。
特徴は、データが平均値の周辺に多く集まり左右対称で、平均値から離れていくとサンプル数が急激に減ることです。
「正規分布」は、ランダムな現象を扱うときに有用な分布です。
身長とか、偏差値などが例としてあげられます。
データが平均値の周辺に集まっている分布は、直感的には想像しやすいですよね。
ほとんどのものが、この「正規分布」に従っているのではないかと思えます。
ところが、そうでもないらしいんですよ。
実は、タイトルの表紙にもしている、「べき分布」に従う現象がたくさんあることがこれまでの研究でわかっているんですよ。
イタリアの経済学者パレート、「べき分布」を見つける
1980年代、イタリアの経済学者パレートは収入分布について研究していました。
なんとその分布は、「正規分布」のようにはなっていませんでした。
収入の分布は、「べき分布」になっていたのです。パレート分布ともよばれるので、この名前は聞いたことがある人は多いかも。
「べき分布」は、こういうグラフになります。
特徴は、左側にサンプルが集中しているんだけど、かなり右のほうにいっても(裾野に向かっても)サンプルが存在していることです。
つまり、ほとんどのものは小さい値なんだけど、極端に大きい値をもつサンプルも少しあるということです。
パレートは収入の分布がこのようになっていたことに対して、パレートの法則というものを提唱しました。
それは、富の8割は人口の2割によって支配されるというもの。
80:20の法則とも、よばれます。
この分布では、平均という概念が意味をなさなくなります。
例えば平均年収が、500万だとわかったとしましょう。
その数字を見て僕が「じゃあ、僕の年収もこれぐらいかな」と思っても、実際は500万より少なくなる可能性が高いです。
なぜなら、ごく少数の超お金持ちが、平均年収を上げているから。
「べき分布」では、かなり右側までサンプルが存在してましたよね。
億万長者があそこに位置しているんです。
だから僕の収入は、現実的に考えれば、平均値より少ない可能性が高い。
こういった理由で、平均があてにならないのです。
そして、この「べき分布」は収入以外の分布でも多く発見されています。
地震の大きさと発生頻度
株価
本の売り上げ
といったものです。他にもまだ、たくさんあります。
noteとかYouTubeなんかも、そうなんじゃないかな。
ありえないことが起きる
先ほど、「べき分布」が世の中に意外と多いということを述べました。
つまりそれは、平均からは遥か遠くに離れた、ありえない現象が起こることを意味しています。
ポジティブにも、ネガティブにも。
まず、ポジティブな例を考えます。
noteを書き始めた人を、想像してください。
書き始めた頃のnoteの記事は、他の人が書いているnoteに埋もれてしまいます。
「べき分布」の左側にいる状態です。
でも、書き続けていくうちに文章力が上がって幸運も味方すれば、とんでもなく読まれる記事が生まれる可能性があるわけです。
認知度が高まれば、一気に読まれるようになるので。
つまり、「べき分布」の右端のとんでもない成果を出している、書き手になれる可能性もあるのです。
読まれている文章の大半は、少数のアカウントに集中している気がします。
実際にデータを使って、分布を出してくれる人がいないかな。
次に、ネガティブな例を考えます。
これは、株価を例にしようと思います。
株価の大暴落なんかが、良い例だと思います。
株価の動きは、基本ランダムなんですけど、リーマンショックのときみたいに、たまに大暴落することがあります。
これも「べき分布」の右端の現象です。
起こる確率はとても小さいけど、たまーにとんでもなく株価が落ちることがあります。
実際、株価の動きを正規分布のように、平均値から大きく動かないと考えてリスク計算していた投資家は、リーマンショックで破産したそうです。
ありえないことが意外と起こってしまう、この世界。
「絶対は絶対にない」
この言葉は、「べき分布」を言い表していると思います。
変化が激しくなっている現代では、さらに「べき分布」の傾向が高まっているかもしれない。
そんな世界は恐怖もあるけど、僕は逆に面白さもあると思います。
ポジティブな意味で、ありえないことが起こる可能性もあるから。
ほとんどが平均的な「正規分布」の世界よりは、スリリングな「べき分布」のほうが、個人的には生きてて楽しいと思います。
ずっとコーヒーカップでぐるぐる回っているより、ジェットコースターみたいな人生のほうが楽しいじゃん。
絶叫マシンは苦手ですが笑。
まとめ
今回は、世の中に「べき分布」が多いということと、具体例を挙げて「べき分布」がどんな特徴を持つのかということを、説明しました。
予想もしなかった最悪の出来事に遭遇する可能性もあるけど、最高の出来事に巡り合う可能性もあると思うと、「べき分布」の世界もなかなか良い世界なのではないでしょうか。
おまけ
「べき分布」のグラフをPythonで描いてみました。
べき分布の定義式は
$$
f(x)=\frac{C}{x^{a+1}} (x\geq b)
$$
です。ここで、$${a,b\geq 0}$$、$${C=ab^a}$$です。
描いたグラフは、$${a=2}$$、$${b=1}$$としました。
ついでに「正規分布」のグラフも、載せておきす。
式は
$$
f(x)=\frac{1}{\sqrt{2\pi}}\exp{\left(-\frac{x^2}{2}\right)}
$$
です。$${\exp}$$は指数関数です。
noteで初めてPython使ってみたんですけど、慣れたら手で描くより楽なので、次からPythonでグラフ描こうかな。
この記事が気に入ったらサポートをしてみませんか?