意識調査は証拠たりえるか

 ダニエル・カーネマン著、『ファスト&スロー あなたの意思はどのように決まるか?』から刺激を受けて。

 ヒトの判断能力は当てにならない──専門家だろうと大学教授だろうと例外なく。様々な実験でそれを露わにする本書は読み物としても面白い。

 これを踏まえて本稿では標題の問題意識に繋げる。
 意識調査の多くは、客観的証拠として採用しにくい

 いきなり結論を述べてしまったが、『ファスト&スロー』の内容をご紹介してから戻るとしよう。


◆2つのモデル:エコン&ヒューマン

 著者のダニエル・カーネマンはノーベル経済学賞を受賞している。ただし古典的な経済学の業績ではなく、むしろ古い常識をぶち壊した側だ。

 古典的な経済学では、経済活動を行う人間を『合理的な主体』だと想定モデル化していた。人間の合理性を前提に様々な理論を組み立てていた。
 カーネマンらはその前提に異を唱えたのである。『実際の人間はそんなに合理的ではない。経済学が前提にしているのは実在しない架空の人種だ』と。
 その差異を強調するために、古い経済学で想定されていた合理的な主体を『エコン』と仮称する。

□エコン(合理的な判断の主体)

 経済畑でいう『合理的』は専門用語で、日常用語とは少し意味が違う。大まかには『客観的で一貫した判断基準に従う』ぐらいの意味。エコンの中にも個人差は想定されており、ギャンブルを好む人も好まない人もいる。ただし全てのエコンは客観的で一貫している
 次のようなギャンブルに乗るか乗らないかで言えば、利得の期待値だけ﹅﹅で判断するということだ。

  1. 参加費は無料。3割で1万円を得られる。7割で5千円を失う。

  2. 参加費は1万円。3割で2万円を得られる。7割で5千円を得られる。

 1.と2.のギャンブルは、客観的な利得としては全く﹅﹅同じ﹅﹅である。だから1.に参加するエコンは2.にも参加するし、1.を断るエコンは2.も断る。そのどちらかだ。

 しかし実際の人はそうではなかった。
 様々な人間を多数集めてランダムに分け、1.2.のように『質問の仕方だけを変えた同じギャンブル』を提示した時、その参加率は顕著に異なっていた。2つを同時に示しても──両方参加や両方拒絶を選んでも良い──片方だけに参加するという『不合理な』人間が多くいたのである。しかもそこには金融や数学の専門家まで含まれる。

 このように、実際の人間の反応から得た実証を用いて研究するのが実験心理学だ。
 実験心理学の知見を以て古典経済学を見れば、『そんな人間は実在しない』と言わざるを得ない。

□ヒューマン(様々な要因に左右される主体)

 質問の仕方によって選好はんだんが変わってしまう。フレーミング効果などと呼ばれる現象だ。
 こういった心理効果は極めて強く、無視はできない。あらゆる人の選択を決定づけるような強制力は持たないけれども、多数の人の選択を左右する力は統計上の有意を軽く超えてくる。

 非常に鮮やかな例を1つ挙げよう。
 脳死後の臓器提供への事前同意率を、国別に比較したグラフだ。

引用元『Do Defaults Save Lives?

 左側(デンマーク、オランダ、英国、ドイツ)と右側の諸国とで大きな差がある。
 驚くべき落差だ。ここにある国々はいずれも(調査時は)EUに属し、地理的にも文化的にも大きな距離は無い。各国民の平均的な倫理観や優しさにさほどの差があるとは考えにくく、同意率の差には別の原因があるはずだ。

 そしてそれははっきりしている。
 単純に、同意の取り方が違う。

  • 青グラフの国々はオプトアウト式(明示的に拒否すれば拒否はできるが、デフォルトは同意

  • 黄グラフの国々はオプトイン式(明示的に同意した人だけが臓器提供者となり、デフォルトは拒否

 グラフを見れば明らかなように、この違いが同意率に与える影響は非常に大きい。

 エコン的に言えば、『オプトアウト式で臓器提供を拒否する』ことと『オプトイン式で臓器提供に同意しない』ことは等価だ。だからどちらの制度でも、同意するエコンは同意するし拒絶するエコンは拒絶する。それなら国ごとにこんな差は出ない。
 エコンならば等しく扱う2つの選択肢に差をつけるのは──すなわち設問の言葉遣いなどに判断を左右されるのは、一体なぜなのだろう。

 ヒューマンが愚かだから? そのような卑下も間違いとは言い切れない。
 ただし『不合理な』判断をしたヒューマンとて、それらが数値的・客観的に同じであること自体は分かるのだ。


◆2つのシステム:ファストはやい方スローおそい方

◯(注意)
 本書ならびに本稿で用られる『システム1』『システム2』はどちらも説明のための仮設モデルだ。
 ファスト(1)&スロー(2)の2系統に分けると『実験で分かったことを説明しやすい』というだけで、『解剖学的にそういう神経回路が見つかった』などの事実は無いので、誤解なきよう願いたい。

□システム1の驚くべき性能

 単語に置き換えるなら『直感』『感覚』『経験』などが近い(しかしそのどれともイコールではないのでシステム1と呼ぶ)。
 システム1の特徴は良くも悪く﹅﹅即断即決なことだ。

◯例1
 家族や親しい人が『おはよう』と一声かけてきた時、ダミ声や鼻声ではないのに体調が悪いことを察する──こんな判断はシステム1の領分だ。
 何を根拠としてそう思ったかは判断した側にも分からないことがある。ちょうかく顔色しかく体臭きゅうかくか……しかしそれらは、客観的には毎日違うはずなのだ。日々の挨拶で精確に同じ発音をする人などいない。
 にも関わらず何らかの違和感を拾い上げる。

◯例2
 見知らぬ人物ばかりが10〜20人ほど写った集合写真を短時間だけ見せるという実験がある。

  • ほとんどの人物が笑顔で、1人だけ怒っている写真

  • ほとんどの人物が怒っていて、1人だけ笑顔の写真

 どちらの写真を見せる時も、全員を細かく見るような時間は与えない。
 それでも前者で怒っている1人が見過ごされることはほとんどないという。後者の場合に笑顔を見落とす確率の方がずっと高いらしい。

◯例3
 親しい間柄での日常的なコミュニケーションは、文字に書き起こしてみるとはっきりするように、非常に曖昧である。

ねぇ、アレ取って。

極端な例

 こうした曖昧な──悪く言えば雑な──コミュニケーションは、多くの場面で問題なく通じる。『AともBともCとも解釈できるけど、多分Aを取ってほしいんだろう』などの推論が働くのだ。

 もちろん判断を誤ることはある。
 体調には何の問題も無いかも知れない、怒って見えた人もよく見れば固い笑顔かも知れない、手渡したAは『アレ』ではないかも知れない。
 それでもシステム1は何らかの答えを返すし、運任せよりはずっとマシな確率で正答する。

 どうやっているかは脇に置こう(興味深いが、大脳生理学や言語学の専門家が長年頭を抱えるような難問なので)。
 確実に言えるのは、何らかの判断システムが存在し、それが有益な場面も多々あるということだ。

□システム1の驚くべき欠陥(1/3)

 一方でシステム1は困った特徴も併せ持つ。

 ひとつは常に無意識に働くためオフにできないことだ。

よく知られた錯視の例(ミュラーリヤー錯視)

 この例は良く知られているし、知らなくても定規をあてて測ってみれば中央の線分が同じ長さであることは分かる。
 しかしそれを知ってもこれらを同じ長さだとは感じられないだろう。錯視を起こす何らかの認知機構を意図してオフにすることはできない。どんなに賢く論理的な人であっても。

 また、家族の不調を察した判断のようにシステム1はその判断の根拠を自覚しない。聴覚や視覚や嗅覚……良く言えば『すべてを使って総合的に』、悪く言えば『なんとなく』での判断だ。

 恐らく野生環境での生存戦略としては正しいのだろう。常に捕食者を警戒し、気配を感じ取ったならまずは動く──逃げるにせよ戦うにせよそれが先決だ。杞憂ならそれで良いのだし、目視か臭いかなど重要ではない。

 システム1を速さで特徴づけるのはこれ故だ。正確さは無意識に犠牲とされ速さが優先される。実のところ我々は、システム1で何を判断しているかさえ自覚していないことが多い(後ほど詳しく述べる)。

□システム2の特徴

 単語に置き換えるなら『理性』『数理』などが近い(どちらもイコールではないのでシステム2と呼ぶ)。
 システム2はシステム1の苦手を補完する。
 ただしシステム1よりずっと遅い。鈍重や怠惰と言えるほどに。
 意識的に働かせない限りは何もせず、働かせてもなるべく省力化を図るサボり魔で、常時動作させ続けるようなことも不可能。

 前の章で、『質問の仕方だけを変えた同じギャンブル』の例を挙げた。
 ほとんどの人のシステム2は2つが等価であることを正しく認識できる。システム2の判断はエコンのそれに近い。
 しかし人が実際にとる行動はそれに合致しない。システム2は可能な限りサボろうとするらしい。


◆2つの自己:体験&記憶

 ギャンブルには金銭や確率という明確な数値があり、システム2に従えば正しく判断できることも多い。それでも人はエコン的な判断をしない。
 もっと主観的で数値化できない判断になると、客観性や一貫性はますます怪しくなる。

 例えば痛みに対する評価だ。
 足つぼマッサージなどは時に相当な痛みを伴う。好んで通い続ける人に訊ねても痛いと答えるだろう。
 これは不思議な言い分だ。痛いのに通うのは何故か?

 人が感じる不快感に注目したカーネマンは冷水実験というものを行った。
 内容は次の2パターン。

  1. 14℃の冷水に60秒手を浸す。60秒で終わり。

  2. 14℃の冷水に90秒手を浸す。ただし60秒経過時点から僅かに加熱され、16℃まで温められる。

 プールで遊泳に適する水温は26℃以上、下回るとしても22℃未満はNGとされることを考えれば、14℃はかなり冷たい。16℃に上がっても大差は無く、冷たさは痛みにも近いはずだ。

 それを踏まえて1.2.のどちらがより不快か。
 明らかに後者の方が不快と予想できる。開始から60秒間の不快感は全く同じで、その後の30秒も温水にまではならないのだから。
 そのはずなのだが──、

□体験する自己&記憶する自己

 冷水実験を受ける人の半数には、目盛りの上を動かせるマグネットのような物を渡して『その時々の不快感』を評価してもらった。

  • 両パターン:開始直後から強い不快感を示し、右肩上がりが60秒時点まで続く。

    • パターン1:冷水から手を抜いて不快感はストンと急落する。

    • パターン2:僅かながら加熱が始まって緩やかに和らぐが、まだ30秒ほど不快感が続く。

 リアルタイムで報告してもらった回答は先述の予想に近い。
 しかしリアルタイムではない回答はまるで違う。残る半数に、1.2.の両方を体験してもらった後で次の質問をしたところ──、

『1.2.のどちらかをもう一度やらなければいけないとしたら、あなたはどちらを選びますか?』

──体験するリアルタイムな自己の報告を踏まえれば当然1.だと思われるが、多くの人が2.を選んだ
 記憶するふりかえる自己が重視するのは、どうやら不快感の総量ではないらしい。

 足つぼマッサージなどの施術も痛い手技では終わらない。予定されている施術時間のラスト1分以上は優しく心地よいマッサージだけで終わるのが一般的だ。
 そのような時間を設ける場合(冷水実験の2.に近い)と、非常に痛い足裏で終わる場合(1.に近い)とでは、利用者に残る記憶いんしょうは大違いになるだろう。

(かなり説明を端折っているが、冷水実験は被験者を最低4グループに分ける。1.→2.の順で受けるリアルタイム回答群/2.→1.の順で受けるリアルタイム回答群/1.→2.の順で受ける振り返り回答群/2.→1.の順で受ける振り返り回答群 だ。順序による差はあったが、体験⇔記憶による差よりは小さかった)

□認識し易さ(システム1の欠陥2/3)

 前の章で、システム1は『すべてを使って総合的に』判断すると説明した。
 ただしこの『すべて』は不均等に重み付けされる──例えばかつて体験した(記憶する)痛みは『トータルの大きさ』よりも『最後の大きさ』に左右されやすいように。言い換えれば、(時間的に近いなどの理由で)認識しやすい情報ほど判断に影響を及ぼす

 例えば新しいワクチンや治療薬について。
 身近な人が重い副作用で苦しんでいる人は、そうでない人よりもその薬を忌避するだろう。

  • 『身近な人の苦しみ』は非常に認識しやすい。だから判断を左右する力も大きい。

  • 『同じ薬を使ったが大した副作用が起きていない何万もの人』は報道などの扱いも軽いし、万単位の大きな集合もシステム1は認識しにくい。だから判断に及ぼす影響も小さい。

 はっきり言うなら統計を無視した誤謬だが、システム1にとっては普遍的で典型的な判断である。
 だって、認識しにくい情報までいちいち参照していたら決断が遅くなるではないか。

□問題の変換(システム1の欠陥3/3)

 次の論点は『即断即決を旨とするシステム1が、判断を下せない問いに直面したら』だ。
 ようやく標題の本旨に近づいてきた。

 満足度などの意識調査を思い浮かべて欲しい。
 『今の職場に就職して良かったか』とか『この学校に進学したことをどう思うか』とか……ここでは既婚者に向けられた『結婚に満足しているか』を例としたい。
 ありふれた問いだが、システム2で答えるのは実に難しい。

◯意識調査の答え難さ
 まず変数の多さが問題だ。
 例えば『ひとりで趣味に没頭できる時間』。未婚の方が長く取りやすいから、この点だと結婚はマイナス要因になる。
 とはいえ趣味の時間は人生の幸福のすべてではない。そうするとまず『自分の幸福度を左右するような要因』を趣味以外にも余さず挙げ連ね、それぞれについて比較検討が必要ということ。

 また、この比較を『結婚の』で行うのは妥当ではない。
 結婚してもしなくても年齢は重なっていくし、職場での立場なども変わっていくからだ。ここでは満足度を問われているのだから、結婚とは無関係な変化の影響は排除すべきである。
 つまり〈40歳既婚の自分:20歳独身の自分〉ではなく〈40歳既婚の自分:40歳独身の自分〉で比べないと答えにならない。

 エコン的な視点で結婚の満足度を答えようとすれば、結婚していなかった場合の自分の幸福度を克明に想像し、あらゆる項目を挙げてそれぞれ評価し、それらを総合して比較することになる。
 答えるのが難しいとはこういうことだ。

 言うまでもなく、ヒューマンはそんな風に考えない。システム1は驚くほどの短時間で『結婚への満足度』を弾き出す。
 どうしてそんなことが可能なのか?

◯システム1の対処法
 カーネマン氏の説はこうだ。『即座に答えを出せない問いに直面したシステム1は、問いの方を答えやすいものに変えて答える』。

 恐ろしい仮説だ。しかし根拠はある。

 ある実験では、大勢の被験者を2つのグループに分けてアンケートに答えてもらった。ここ数年ほどを振り返り各自の幸福度を10段階で答えるものだ。

 グループ分けはランダム。どちらのグループも質問の文章や答え方は同じ。条件を変えたのはただ1点。
 しかしその1点で、両グループの平均幸福度には大きな差が出た。
 片方のグループにはただ回答用紙を渡して答えてもらい、他方には次の依頼を付け加えたのである。

『申し訳ない、その回答用紙は原本なので直接記入しないでください。お金は渡しますからコピー機で用紙をコピーして、そこに答えを書いてもらえますか』

 こちらのグループは面倒臭そうにしながらコピー機へ行く。そこには誰かが忘れたらしい小銭が放置されている(実験者が意図的に置いたもの)。
 金額はごく小さい。缶ジュースも買えない、交番に届けるほどでもない、ネコババしても罪悪感が疼かない、そんな小銭。どう考えても『ここ数年の幸福度』を左右する額ではない。
 にも関わらずこちらのグループの方が幸福度は有意に高かったのである!

 システム1は『ここ数年の幸福度』など答えられないのだろう。時間的に長すぎるし、良いことも悪いこともあったはずだから複雑すぎる。そしてわざわざシステム2で綿密に計算するのも多くの人は面倒臭がった。
 しかしシステム1は『回答不能』を良しとしない。正確さよりも速さを本分とするこの特性は、問題の側を書き換えて即答する
 恐らく被験者が答えたのは、『ここ数年の幸福度』よりも『今この瞬間の気分』に近い。でなければ小銭程度の幸運は統計の揺らぎに埋もれたはずだ。

 これが前章で触れた、『何を判断しているか自覚していない』の実例である。我々は日常的に問題の置き換えを行い、しかもそれを自覚しない。なにせシステム1は常に無意識下で働いているのだ。

 家族の不調をどうやって気取ったかうまく説明できないのと同様に、自らの幸福度をどうやって数値化したのかも説明は困難だろう。
 であれば、『言語化不能なプロセスによって正しく問いに答えた』のか『言語化不能なプロセスによって答えやすい問いに変えてから答えた』のか、断言できる人などいない(常に後者であるとも限らないが)。


◆まとめ&おまけ

□結論

 意識調査の結果を何かのエビデンスや根拠として用いることは、極めて慎重になるべきだ
 結婚観や男女論の文脈では、アンケート結果を安易に事実と扱う傾向が多く見られる。

 上の記事では以下の調査項目が報告されている。

  • 交際経験の有無

  • 『結婚を意識する相手としか付き合わない』への同意度

  • 『恋愛は時間とお金の無駄である』への同意度

  • 結婚したくない人の理由(選択肢からの複数回答)

 1つ目は事実を問うものだ。中には不正直な回答もあるかも知れないが、本稿で扱ったような心理的な誤謬はさほど警戒せずとも良い。

 しかし2つ目以降は違う。想像と比較検討を要する問いであり、確率や利得といった数字も不明。
 問題の置き換えは発生しやすく、フレーミング効果による誘導も避けられず、そして多くの回答者はそれを意識しない。

 〈『結婚を意識する相手としか付き合わない』への同意度〉は〈『結婚を意識しない相手とも付き合う』への同意度〉の裏返しではない。エコンなら裏返すだけで実情を掴めるが、ヒューマンは訊き方ひとつで答えを変える生き物だ。
 〈『恋愛は時間とお金の無駄である』への同意度〉も、〈『恋愛は時間やお金の有意義な使い道である』への同意度〉を問うていれば結果が違った可能性は大いにある。

 (特定の企業を責める意図はないが)一般論として、世情をありのまま捉えるような中立性を営利企業に求めることは難しい。自然な──婚活サイトなどを介さない──恋愛や結婚の減少は、企業のビジネスチャンスになりえるからだ。
 少なく見せる為に(『婚活サイトなどを使わないと結婚できない時代ですよ』と訴えるために)恣意的なアンケートを行ったと決めつける根拠は無いので意図までは断定しないけれど、どちらが会社の利益になるかで言えば減った方が得だろう。
 企業が利益を追及するのは当然の原則である。

 仮にこの調査が学術的な調査なら調査報告の詳細には質問票をそのまま載せるはずだが、本件にはそれも無い。

 多数の人間が抱く情を他人が推し量るのは不可能で、本人に訊くしかない面はある。しかし本人に訊けば分かると考えるのも誤りだ。エコンは実在しない。

□おまけ

 最後にひとつ、小さな幸福をもたらすかも知れない実験をご紹介。

 大勢の被験者を集めてランダムに2つのグループに分け、あるお菓子を食べて味を採点してもらった。
 ただし両グループに提供するのは同じお菓子だ。他の条件も次の1点以外は揃えてある。

  • グループA)眉をギュッと寄せた表情のまま食べて下さい。

  • グループB)頬をクイッと持ち上げた表情のまま食べて下さい。

 つまりしかめっ面(A)と笑顔(B)を模してもらうわけだ。
 下らない実験と思われそうだが、実験結果は差を示した。Bグループの方が平均評点が高い──つまり美味しく感じたという。

 どうしてこんなことになるのか、機序ははっきりしていない。実験心理学は事実を示すだけだ。
 とはいえ機序は必要だろうか? それだけでほんの少し幸福感が得られるなら、心は別として形だけで良いなら、笑顔をかたどる位はさほどのコストではないとも考えられる。

 筆者は仏教徒とは言い難いけれども、和顔施という考え方は好ましく思う。

以上

Twitterだと書ききれないことを書く