記述統計学と推測統計学

記述統計学

記述統計学という語に、descriptive statistics という英訳が付けられています。descriptive は、動詞 describe(記述する、描写する、説明する) の形容詞形で、結果として記述(描写・説明)されたものが description です。

ところで、「西洋美術史入門」という本に、こんな説明があります。

ディスクリプションとは、絵を文章で説明する作業であり、言い換えれば視覚情報を言語情報に直すことです。(中略)すなわち視覚情報を「データの集合体」としてあつかう作業にほかならないからです。

池上英洋 2012「西洋美術入門」筑摩書房、Kindle 位置35

これにならえば、心理統計学というのは、「人の心の在り方や動きを、データの集合体としてあつかう作業」であり、データの集合を言語情報として表したものがディスクリプション、すなわち記述統計だといえます。
単にデータを使って計算して、はいできました、というのは、ほんの見かけの話であって、データを使って何を表現し何を考え、何を伝えたいのかを見失ってはいけないのだと思います。

推測統計学

そこへいくと推測統計学はもう少し視座が違います。誤解を恐れずに書くなら、記述統計は推測統計学のための道具のひとつです。
調査や実験に協力いただいて、データが集まりました。そのデータはこんなことを表していました。ここで終わるのが記述統計。
ということは、つまり****、ということなんだね? まで突っ込んでいくのが推測統計。

****の部分は、たとえば「母集団でも、こういう特徴があると考えられます」みたいなのが入る。母集団?
母親の集団ではありませんよ。詳しくは第7章以下で学びます。

練習問題


Q1:「データ」とはどのようなものを指していますか。


Q2:次の文章中の下線部は、たとえばどのようにコーディングすることが可能ですか。
(例)私の父は、2年前に還暦を迎えました。(回答)「62歳」という数値、「60歳代」というカテゴリ、「中高年」というカテゴリ等(唯一の正解があるわけではありません。以下同じ)

  1. 4年制大学を卒業後、今の会社に就職しました。

  2. 高校時代、数学は大嫌いでした。

  3. 毎日忙しくて、朝食を食べない日が週に2~3回あります。


Q3:記述統計学で用いるデータ要約の主な手法を2つ挙げてください。


Q4:推測統計学について書かれた次の文章はそれぞれ正しいですか。誤っているのであれば、どこがどのように誤っているかを指摘し、正しい文章に直してみてください(当然ですが、正しい文章に唯一の正解はありません)。

  1. 推測統計学は、データの発生源である母集団の特徴を推測することが目的である。

  2. 推測統計学では、母集団の全員からデータを集めることが必要である。

  3. 科学的な心理学研究を行うためには、推測統計学よりも記述統計学が重要である。

  4. 推測統計学では、確率の考え方を用いて、大きな集団の性質を推測している。


以下、解答案です。


Q1:主にカテゴリや数値によってコーディングされた情報のこと

  • 「データ」とはこのように定義されるべきである、という意味ではないことに注意してください。「この教科書では」このように考えています。そして、「データ」のように、日常語として聞きなれている語ほど、それが教科書の中ではどのような意味で使われているのかに注意を払う必要があります。


Q2:たとえば次のようなコーディングが考えられます。このように、「どんな質問をして、どんな選択肢から選んだのだろう」のような想像をすることは、調査結果を読むうえでのスキルの一つです。

  1. 「大卒」(あなたの最終学歴はどれですか? という質問に対して「高卒以下」「大卒」「大学院卒以上」などから選択する場合)。あるいは「1」(あなたは大卒またはそれ以上ですか? という質問に「はい/いいえ」で答えていて、「はい=1、いいえ=0」と対応付けている場合)

  2. 「大嫌い」または「1」(数学は好きでしたか、嫌いでしたか? のような質問に対して、「大嫌い~大好きな」どの5段階から選択している場合、また、それを1~5の数に対応付けている場合)

  3. 「2」または「3」(1週間のうち、朝食を食べない日は何日ですか? というような質問に対して、具体的に日数を答えている場合)、あるいは「ときどき」(朝食を食べない日がどれくらいありますか? という質問に対して、毎日、よく、ときどき、ない、などのカテゴリから選択している場合)。


Q3:①データの可視化、②統計量の算出

  • 教科書に書いてある通りです。その具体的な内容は第2章以降で学びます。


Q4:正しいのは1と4です。2と3の誤りは次のように訂正できるでしょう。

  • 2. 母集団の全員からデータを集められるのなら、推測統計は必要ない。ただし、そのようなことは通常極めて困難である。

  • 3. 心理学が対象とするのは「日本人」などの大きな母集団であり、推測統計学によって結論を一般化するための議論が不可欠である。