(6):用語の意味を問う問題(推測統計編)

難しいです。はい。

推測統計の用語って難しいです。使われている単語ひとつひとつは、それなりに耳にしたことがあるものなんだけど、「説明して?」とか言われると5秒くらいフリーズした後に、「えーっとね…」と言ったきり、笑ってごまかす自信があります。どんな自信なんだか。

7章からがこの教科書の本番

「心理学統計法」の教科書で、第7章から急に訳が分からなくなった、という人はいません? それ、正しい感覚だと思います。この章から、推測統計の話になります。推測統計って何か、などを短く語ってしまうのは危険なのでしないけど。それっぽい例を一つだけ出すと、「「データの平均」は確率変数であり、「データから計算された平均値」はその実現値である」となりますね。あ、ちょっと待って。あっているかどうかは自信がない。

確率変数

これまでに、出題されている用語は、第7、8章で初出する用語が多いのですが、そのうち、「確率変数」の説明として適切なものを選べ、という問題は出ていないようです。というわけで、ここからは確率変数の話。

「確率変数とは、マリオカートのハテナボックスである」というのが、私が過去に聞いた説明の中でもっとも面白いものでした(失礼!)。マリオカートというゲームを知らない人(私もその一人)には、何のことだかさっぱりだと思いますので、そういう方は、YouTubeでマリオカートのゲーム実況動画なんかを探してみてください。私もそうしました。見てみると、なるほどこれか!と納得するはずです。
要するに、ハテナボックスをゲットすると、そこから「何かの」アイテムが出てくるのですね。アイテムの種類は有限でしょうし、「よく出てくる(またこれかよ!)アイテム」もあれば、「レアアイテム(やったー!)」もあるでしょう(プレイ経験のない人が書いているので、過度に信用しないように)。アイテムによって、その「出やすさ」が異なるわけで、このあたりが確率変数の振舞いにとても近いものがあります。
ちなみに、「確率変数とは、マリオカートのハテナボックスである」は、「心理学統計法」の主任講師の先生の名言です。ありがたく拝聴しましょう。

確率変数を目撃しよう

マリオカートをプレイしない人たちは、基本的に、確率変数そのものを目にすることはほとんどありません。でも、確率変数らしきものを目にするのはそれほど難しいことではありません。
お財布の中からコインを1枚出して、それを投げてください。注意。ちゃんと机の上に落ちるように投げましょう。コインがなくなっても責任取れませんよ。
投げたコインが空中にある間、あなたは確率変数らしきもの(=コイン)を目にすることができます。「このコインは表か裏か、どちらかが出るはずで、大抵の場合、表が50%、裏が50%の確率で出ると思われるぞ~」と思いながら、空中を漂うコインを見てみましょう。コインが机に落ちるまで、ほんの数秒の間、あなたは確率変数らしきものを見ることができる。そして、机に落ちたとき、あなたはゆっくりと「確率変数の実現値」(つまり「表」または「裏」という結果)を確認することができます。ハテナボックスに比べると、少々面白みに欠ける気はしますが。

とはいえ、心理学の研究でコインを投げたりサイコロを投げたりすることは、まずありません。コインを投げたり、サイコロを投げたりしても、人の心についてはおそらく何もわからないからです。心理学実験でマリオカートをやってもらうことも、たぶんないでしょう。「お、このアイテムが出たから、この人の心理状態は**だ!」とか言い出す研究者とは話をしたくない。

私たちは確率変数?

人の心について何かをしるためにデータを集める、という意味では、街を歩いている人々はすべて確率変数です。少なくとも、その人が、BIG5についての質問や、自己肯定感についての質問に対して返してくれるであろう回答を、確率変数の実現値として扱っています。
そう、確率変数の実現値がそこで1つ(複数の質問をして、質問の数だけ実現値が得られるとすれば、実現値が1組)得られるわけです。あ、でも本当にやらないほうがいいです。歩いている人にいきなり質問を投げても、「誰?」と思われて怪しまれるだけだし、いわゆる「無作為抽出」とは程遠い方法になってしまうからです。無作為抽出についてはここでは深入りしませんよ。話長~~~くなるので。

ということで、あなたの手元に集まってきた数値たちは、どこかの誰か(無作為抽出されたであろう人々)が答えてくれた数値、つまり確率変数の実現値たちです。

これまで何回かひとり雑談を書いてきましたが、一番くだらない雑談かもしれませんね。読んでくれた人はいるのかなあ。