見出し画像

【1分で分かる統計学】株価と金利、為替の関係で説明する統計学のワナ。

今日はちょっと堅苦しいお話しですが、出来るだけ分かりやすくご説明します。
まず、株価をY、金利をX1、為替をX2とします。次に、y=ax1+bx2の形を思い浮かべてください。
このときxを説明変数、yを被説明変数と呼び、この式じたいを回帰分析と言います。

なにをやっているのかは金利と為替が株価を説明しているということを統計学的に実証しようとしているのですが、このとき、x1とx2のあいだにナニカがあることがあるのです、そのナニカとは相間です。

 x1とx2のあいだに相間があると多重共線性という難しいコトバと問題が発生します。分かりやすくいうと、見かけの説明精度だけ上がってしまい、実際の説明精度が低いというサイアクな状況です。

多重共線性を避けるには、データの量を減らす、もしくはそのほかの処理が必要になりますが、皆さんが日ごろ見る情報はすべてどこかのコンピュータがその処理をしているのです。

たびたび例に出しますが成田悠輔氏の凄いのは、x1からx20とかいっても計算が狂わないところです。
よくインターネットなどで紹介される彼の論文で「たとえ優秀な学校へ行ったとしてもその後の人生の幸せとは関係がない」があります。

あの論文についてだったかは定かではありませんが彼の論文のスタイルとしてあの「日経テレ東大学」で、人種や目の色まであらゆる補正をかけて、それでも多重共線性のワナを潜りぬけ、「実際の説明精度」を確保しているか、猪口議員に語っていました。

その冒頭のやり取りで統計学者はうなっていたと思います。35才。20から30もの説明変数を入れても被説明数を決定係数、R2(アール・スクエァ)を確保できる。頑健性を保ったままで。このような作業はもうほとんど統計学というよりコンピュータサイエンスの領域で学際分野です。経済の院生は経済史以外はほとんど理系に進む覚悟で行かないといけませんね。修士論文の時点でWordはまったく使わず、Stataという統計ソフトで大学から持ち帰ったデータをひたすら分析し、新しいデータを取りに行く、というくり返し。論文にまとめるのは最後の1、2週間で十分です。
博士はもっと大変でジャーナル掲載クラスの論文を2、3本目指さなければいけません。ここで私は挫折しました。
 
おっと、本題からずれましたね。
だから統計学っていっても、難しくなく、y=ax1+bx2の形を思い浮かべればいいのです。
ただ、x1やx2が縦方向に、というか、紙に式を書いたら下方向にたくさんある。そういうイメージをしてください。
その数の多さをサンプル数と言うのです。

数学的に証明するのはとても面倒ですが、エクセルが「回帰分析」でやってくれるので便利な時代になりましたね!



この記事が参加している募集

お金について考える

計算でつまったらノートに写してみてください。考えてむつかしい場合、コトバでナニが分からないか記入してノートのコピーを送ってください。