見出し画像

「ファスト & スロー」へのコメント

を授業で学生のみなさんに書いてもらいました(レポート課題で)。そこで,公開可と言われたものだけをいくつか載せておきます。公開不可のやつには1万字くらいのもありましたので残念。ちなみに書いてくれたのは非心理系の学部2年生です。

読んでもらった本はこれです。

ダニエル・カーネマン「ファスト&スロー」上・下

それでは以下にいくつかご紹介しておきます。

ーーーーーーーーーー

私たちが思っているほど、私たちは賢いのか。 by ペンネームなし

何をもって賢いとするかは議論の余地があるが、賢いということを合理的であると定義するなら、人間は思っているほど賢くない。多くの人は反論するだろう。人は馬鹿ではない。人が地球で最も栄えていることや、他のチンパンジーなどの生物との比較を根拠にする人もいるかもしれない。それを否定するつもりはない。地球上で人より栄えている生物はいないし、チンパンジーよりは間違いなく賢い。しかし、想像よりは賢くない、という主張を翻すこともない。

その根拠となるのは、Tversky & Kahneman (1981) の提唱したFraming効果である。一言断っておきたいのは、ここで述べる賢さというのは、合理的な判断ができるということである。例えば、
・確実に240ドルを得る
・25%の確率で1000ドルもらえるが、75%の確率で何ももらえない
という選択肢があったとき、迷いなく後者を選ぶことである。さて、あなたは迷いなく後者を選ぶことができただろうか。

これは愚問だろう。なぜなら、前者の期待値は240ドル、後者の期待値は250ドル。こんな簡単な数字の比較を問題にしてしまって、賢いはずの読者諸兄には申し訳のない限りだ。

実はもう一つ、申し訳ないと懺悔することがある。私は、読者の大半が前者を選ぶということを、予測していた。そのうえで、意地の悪い質問をして、皮肉を零した。私のちょっとした遊び心なので、どうか見逃してほしい。ところで、ここで聡明な読者は気づくはずだ。もちろん、私の底意地の悪さにではない。私がどうやって読者の選択を予想することができたのか、という疑問にたどり着くはずだ。その答えこそ、Framing効果だ。

これについて説明するには、先ほどの質問だけでは不十分と言わざるを得ない。面倒かもしれないが、次の二つの選択肢についても、どちらか合理的と思うものを選んでほしい。

・確実に750ドル失う
・75%の確率で1000ドル失うが、25%の確率で何も失わない

この二つの選択肢についても、私はあなた方の解答を予測することができる。読者の多くは、後者の選択肢を選ぶだろう。種明かしをすれば、これは先ほど紹介した二人の論文に記述された実験の1つだ。その実験結果から得られた統計的事実をから発見された現象こそが、Framing効果である。

この効果とは、言い方次第で、聞き手の選択が変わるというものだ。同じ内容でも、言い方次第では賛成され、あるいは反対される。つまり、人は発言内容の論理や合理よりも、字面の上での直感を優先するというわけだ。冒頭で、人間が合理的ではないと述べた理由はまさにここにある。この効果の有用性は、さきほど私が見せた詐欺師まがいの預言だけにとどまらない。自分の意図通りに相手の選択を誘導することもできれば、自分自身の選択をより合理的にすることも可能となる。私が思いつく以外にも、使い道はいくらでもあるだろう。

では、このFraming効果、はたして本当に存在するのだろうか。いささか人間に対して都合よすぎはしないだろうか。あるいは、人の合理性を軽視しすぎてはないだろうか。この疑問はもっともなもので、幾人かの研究者たちが、この効果の再現性が存在するのかと実験の追試を行っている。その中でも、全く同じ実験、つまりは、全く同じ質問をもって再現を試みている論文だけをここでは基本的に扱っていく。私が発見した限りでは、Framing効果の直接的な再現についての記述があったのは、以下の論文である。

- Horton, J. J., Rand, D. G., & Zeckhauser, R. J. (2011). The online laboratory: Conducting experiments in a real labor market. Experimental Economics, 14(3), 399–425.
- Highhouse, S., & Yüce, P. (1996). Perspectives, perceptions, and risk-taking behavior. Organizational Behavior and Human Decision Processes, 65(2), 159–167.
- Miller, P. M., & Fagley, N. (1991). The effects of framing, problem variations, and providing rationale on choice. Personality and Social Psychology Bulletin, 17(5), 517–522.

これらを順に説明していこう。

1つ目では、再現に成功したとの結論だった。こちらの実験で再現したのは、Tversky & Kahnemanの論文にある実験の中でも、Asian Disease problem (アジア病問題) と呼ばれる問題を使ったFraming効果だ。この問題の具体的な内容ついてはGoogle先生にでも聞いてほしい。ここで論じるべきは、内容ではなく、その結果だからだ。Tversky & Kahnemanと違う点としては、オンラインの労働市場から被験者を募った点にある。こちらの実験は無事に成功した (p < .001でした)。

2つ目では、再現に成功したとの結論だった。こちらについても、題材となったのはアジア病問題だ。こちらもp < .01で有意である、との結論が論文中に示されている。

3つ目では、再現には成功したが、その効果はKahnemanが述べたよりも低いとの結論だった。こちらでも、やはりアジア病問題が取り上げられている。ここでは、Tversky & Kahnemanと全く同じ問題の他に、確率を変えた問題でも実験を行っている。合計で14種類のアジア病問題では、オリジナルのアジア病問題のp値は.03とあり、p < .05では有意であるようだ。少し他人事のようになってしまったのは、私のつたない読解力では正直、14種の中から望みの結果を見つけられたのか自信がないからだ。正確に知りたいという方は、ぜひともご自分の目で確かめてほしい。ともあれ、14種類の問題のうち、全てで有意であったわけではなく、Tversky & Kahnemanの効果量よりも低いという結論に終わっていた。一般的には、Framing効果はもっと効果は低い、あるいは適用されるとは限らないということだ。

また、Framing効果について、様々な論文の結果をまとめた論文 (Levin, Schneider, & Gaeth, 1998) があったため、これについても紹介しておく。この論文は、Framingの種類からそのメカニズムを探ろう、という趣旨の論文だ(と、私は思った)。その一環として、Table 2に様々な研究者が行ったFraming効果の再現や類似の問題を使った実験と、その結果が記してある。成功したものもあれば、失敗したものもあり、その内容一つ一つまで精査していないが、ここから言えるのは環境次第でFraming効果が発揮することもあれば、失敗することもあるということである。

これらをまとめると、Framing効果は、Kahnemanの妄想の産物ではないだろう。私はそういう結論に達した。かといって、魔法のような効果があるとも言えない。そもそも、統計から導き出されているので、重力のように、あらゆる物体に100%の確率で働くものではない。集団全体を見れば、多くがあてはまるだけで、全てがあてはまるわけではない。絶対的なものではないのだ。そのうえ、実験のやり方によって、効果の程度に差が出る。そうなれば、これは全幅の信頼を置けるものではない。

と、ここまで否定しておいてこんなことを言うのも変な話に聞こえるかもしれないが、この効果を頭の片隅に置いておくことは有用だと思う。人生を左右するような選択肢をFraming効果のみで乗り切ろうとするのは無理があるが、人間、毎日毎日そんな大勝負をしているわけではない。大半のことは、小さなことの積み重ねで作られている。サンプルサイズが大きくなれば、それだけ統計は有効に働くようになる。Framing効果は繰り返し利用するほど、ほんの少しだけ人生が好転するだろう。そうなればやはり、これは価値のある効果だ。

私と、このFraming効果を引き合わせたファスト&スローという書籍は、心理学を知るきっかけとしては有意義なものだ。初めて読んだときは、正直、かなり心を引き込まれたように思う。しかし、蓋を開けてみると、再現性のない効果、つまりは、Kahnemanの妄想も含まれていた。信頼性という意味では皆無に等しいと思うが、このFraming効果をはじめとしたさまざまな効果を通して自分自身を見つめなおす、自分自身の判断に注意を払うようになるという意味では、大変有益であると思う。これは心理学全般にも言えることだ。統計的な事実や、あるいは、誰かが妄想した心のありよう、それらが今日の心理学を形作っているのだろう。心理学を学ぶことによって得られるそれらの知識は、自分を見つめなおすうえで、とても興味深いサンプルだと私は思う。

引用文献
- Tversky, A., & Kahneman, D. (1981). The framing of decisions and the psychology of choice. Science, 211(4481), 453–458.
- Horton, J. J., Rand, D. G., & Zeckhauser, R. J. (2011). The online laboratory: Conducting experiments in a real labor market. Experimental Economics, 14(3), 399–425.
- Highhouse, S., & Yüce, P. (1996). Perspectives, perceptions, and risk-taking behavior. Organizational Behavior and Human Decision Processes, 65(2), 159–167.
- Miller, P. M., & Fagley, N. (1991). The effects of framing, problem variations, and providing rationale on choice. Personality and Social Psychology Bulletin, 17(5), 517–522.
- Levin, I. P., Schneider, S. L., & Gaeth, G. J. (1998). All frames are not created equal: A typology and critical analysis of framing effects. Organizational Behavior and Human Decision Processes, 76(2), 149–188.


アンカリング効果について by ちゃーなべ

元となる研究は1974年にサイエンス誌に掲載された、Amos TverskyとDaniel Kahnemanの共著によるJudgment under Uncertainty: Heuristics and Biasesである。Tversky & Kahneman (1974) による本論は、大きく分けて「代表性 (Representativeness)」、「可用性 (Availability)」、そして「調整と固定 (Adjustment and Anchoring)」の3項に分けられている。3項の中では様々な実験が行われ、人々がもつバイアスや傾向についてが書かれていた。ここでは後述する論文にも言及されているものについて記述する。

Tversky & Kahneman (1974) は、「調整と固定」の項において被験者に様々な事柄の割合を当ててもらう実験を行っていた。例えば国連に所属しているすべての国のうち、アフリカ諸国の割合はいくつか、といったものである。被験者は割合を予想する前に、1から100までの数字が書いてあるルーレットが一定の数字に止まるのを見る。これは被験者にはランダムに止まっているようにみえるが、実際には10と65のどちらかにしか止まらない様になっている。被験者はその数を見た上で予想を立てるが、10をみた被験者の予想の中央値は25、65をみた被験者の予想の中央値は45となった。これにより被験者は問に直接関係ない数でも、その数の影響をうけてしまう、すなわちアンカリング効果を受けていると説明されていた

また、Tversky & Kahneman (1974) は「50%が赤いマーブル、50%が白いマーブルの袋から1個赤いマーブルを取り出す」「90%が赤いマーブル、10%が白いマーブルの袋から7回連続で赤いマーブルを取り出す」「10%が赤いマーブル、90%が白いマーブルの中から7回中1回でいいので赤いマーブルを取り出す」の3種類のうちどれに賭けるかを被験者に聞いた。被験者の大多数は2つ目の「90%赤いマーブル」の確率を選んだが、実際にこれが成功する確率は48%であり、1つ目の「50%赤いマーブル」を選ぶのがもっとも確率が高いものであった。この例から、二人は大きな数に対して自信を持つ、大きな数字ほど強いアンカリング効果をもつことを示していた。

Tversky & Kahneman (1974) の追試として、1991年にRichard A. Block と David R. Harperの二人によってOverconfidence in Estimation: Testing the Anchoring-and-Adjustment Hypothesisが著されている。Block & Harper (1991) はこの論文の中で、Tversky & Kahneman (1974) のアンカリング効果に関しては、いくつか足りない要素があるといい、ルーレットの実験に関しては、人々がアンカーとなる数字を提示されていない状態での予想が直接的にされておらず、また予想を先に立てた上でアンカーとなる数字をみるとどうなるかの実験が行われていないと指摘した。

上記を踏まえて、Block & Harper (1991) は論文の実験2で「調整と固定」の仮説の検証を行っている。もしも被験者が暗黙的に自分で一度アンカーとなる数値を設定していたならば、その後にこちらから数値を提示してもそれは大きく被験者の予想に影響を及ぼさないのではないかというものである。検証方法として、心理学のクラスから76人の生徒に協力してもらい、1グループ19人にわけ、それぞれ「親しみのあるもの/ないもの」「自分で考えたアンカーあり/なし」の2×2、合計4パターンで50%の信用範囲を予想してもらった。「アンカーあり」に関しては、各被験者に自分の予想を先に紙に書いてもらい、その上でアンカーとなる数字が提示されてもどちらを信じるかは全くの自由であると伝えた。

結果は表で示され、それぞれ「親しみのあるもの/ないもの」「アンカーあり/なし」の状況において予想が範囲内に入っている割合と、範囲比率、そして誤差率が記されていた。親しみのあるものに関しては、アンカーなしが49.6±4.0%、アンカーありが58.3±4.6%、親しみのないものに関しては、アンカーなしが34.6±3.1%、アンカーありが46.1±3.7%となっていた。F(1,72) = 22.7, p < .005となっていることから実験結果は一定の信用をおくことができるとする。この研究は、実験1において別の研究の追試を行っており、その際に用いた実験手順をそのまま実験2に適用しているため、Tversky & Kahneman (1974) の直接的な追試ではなかった。ただし、Tversky & Kahneman (1974) の問題点を指摘し、それに対して新たな視点を組み込んで追試を行ったことは確かである。

Block & Harper (1991) の結果より、自分でアンカーを設定していれば、そのあとアンカーを提示されてもその影響は小さく収まることがわかった。よって、追試の結果を踏まえるとTversky & Kahneman (1974) はその時点ではいくらか要素が不足していると言わざるを得ない。また、サイエンス誌に掲載された論文には具体的なサンプルサイズの記述がなかったためBlock & Harper (1991) のほうがより信用に値するように感じられる。ただし、追試は元研究の結果を修正するものではあるが否定するものではないので、元研究は現段階においても一定の信憑性をもつものであると言うことはできると考える。

ファストアンドスローは心理学の面白い、興味深い『美味しい』部分を切り取って載せた心理学のフルコースのような印象を受ける。著者であるダニエル・カーネマンの自分の話や自分と関連のある、興味のある人物の心理学研究結果を紹介する点についても著者がシェフのような印象をうけ、フルコースという言葉はまさにこの本を言い表すにふさわしいと思っている。ただ、バイアスやアンカリング効果、その他様々な心理学の効果を読んだあとにもう一度自分がこの本を読んだ事実を見返すと、自分もまたこの本を読むことによってなにかのバイアスやアンカリング効果を受けているのではないかと疑心暗鬼になってしまう一面があった。そういう意味では、このフルコースを堪能するということ自体がそもそも何らかしらの心理学の実験に巻き込まれており、それを承知のうえで楽しむものではないかと思った。

今回の研究結果とその追試を踏まえ、心理学とは何かと聞かれれば、いたちごっこと答える。心理学専攻ではないが、人の心は時代に強い影響をうけ、変化していくようなものに思える。ならば、古い研究のほとんどが再現不能なのも理解できるし、追試が頻繁に行われているのも理解ができる。であれば、心理学は信憑性のない学問とは全く言えないし、むしろ常に先を見据えて進んでいる学問のように思える。ファストアンドスローは今後の研究を見据える上での過去の功績のまとめとも取ることができ、そういう観点からすればこの本が出版されたことは非常に大きなことだったのではないかと思える。

引用文献
- Tversky, A., & Kahneman, D. (1974). Judgment under Uncertainty: Heuristics and biases. Science, 185(4157), 1124–1131.
- Block, R. A., & Harper, D. R. (1991). Overconfidence in estimation: Testing the anchoring-and-adjustment hypothesis. Organizational Behavior and Human Decision Processes, 49(2), 188–207. 


サンクコストについて by 310さん

人は合理的とは言い難い。

例えば、既に建てられた建造物の建築費などのように、取り戻すことができないが費やしたものをsunk-cost (埋没費用) という。人は時にこの埋没費用を支払って行動を起こした場合、たとえその行動を完遂することが全体として不利益になるとしてもその行動を完遂しようとする現象が知られており、心理学ではこれをsunk-cost fallacy (埋没費用の誤謬) と呼ぶ。具体的に例えるならば、TSUTAYAで借りたドラマDVDが、自分の予想よりかなり面白くなかったにも関わらず、借りたのだからと時間を費やして最後まで見ようとするのもこの埋没費用の誤謬にあたるだろう。

今回調べたのは、そのような埋没費用にまつわる一つの研究の妥当性についてである。

Marcus Cunha Jr.とFabio Caldieraroはこの埋没費用についての研究を行っており、"we attempt to resolve the issue of whether sunk-cost effects may occur for behavioral investments.", "according to a mental accounting perspective, individuals who invest greater effort should be more likely to switch to the better alternative option than those who invest smaller effort.",  "In contrast, we propose the effort-justification mechanism (Aronson & Mills, 1959; Axsom, 1989) as an alternative underlying mechanism of purely behavioral sunk-cost effects. " (Cunha & Caldieraro, 2009) と、今まで金銭が埋没費用となる状況下でしか確認されていなかった埋没費用の誤謬が行動を埋没費用とした場合にも確認されること、また、その原因として考えられる、人は一つのことについてより努力をして完遂すると、努力がそれよりなされなかった場合よりも満足度が高くなるという現象の確認を目的としている。もしこの説が検証されたならば、人間の非合理に見える思考について生物学的にも考察する一助となり、また一個人にとっては自分の行動を顧みる上で役に立つ理論となるだろう。

論文中では二つの調査が行われているが、第一の調査では69人の大学生に対し、5つの商品の4つの性質にそれぞれつけられた評価点を合計させるというやり方で商品の評価を行うが、その際、一つのグループは評価点を整数で、もう一つのグループは認知的負荷を増大させるために同じ評価点を分数で与えた。そして、5つの商品の中から最も良いものを選んでもらった。その直後、その選択したものよりも評価点が少し高い商品 (small opportunity cost)、もしくは評価点が大幅に高い商品 (large opportunity cost) が発売されたとして、自分が最初に選んだ商品と新しく発売されたより良い商品のどちらを選ぶか、選択するまでにかかった時間、最終的に選んだものに対する満足度を調査した。

第二に、検証をより強固なものにするために、137人の大学生、大学院生を対象に、より現実に近い状況のテストを行った。被験者はペンについての描き心地やインクの質といった四項目について、認知的負荷が低いグループは評価がまとめて1ページにまとまられており、認知的負荷が大きいグループは4ページにわたって評価が分散して書かれているというようにして評価を合計する作業を行った。そして一番良いペンを選んでもらった後で、さらに評価がよいペン (small opportunity cost)、もしくは大幅に評価がよいペン (large opportunity cost) のどちらかを差し出し、同様にどちらを購入するか、選択するまでにかかった時間、最終的な満足度を調査している。

これらの実験結果として、著者の二人は得られたデータは自分たちの説を肯定する上で十分なものであり、自分たちの仮説は採択されうるという結論に達している。

しかしここで、A. Ross Ottoによって行われたこの研究に対する追試をみてみると、"We were unable to replicate the authors’ BISC (*behavioral investment sunk-cost) effect with three different behavioral investment manipulations."と、追試では、この結果を再現できなかったのだとはっきり言っている。なお、追試では一つの調査に対する直接追試に加え、オリジナルの追試二つを加えた三つの調査を行っている。直接追試がなされているのは、Cunha & Caldieraro (2009) のExperiment 1である。オリジナルの追試となるExperiment 2は、Experiment 1と同じ手法を取っているが、違う点は、評価点は全て整数で表されているのに対し、評価点を見るためにSHOWと書かれた画面上のボタンをクリックし、見終わると次はHIDEと書かれたボタンをクリックして点数を隠すというように手間がかかるようにしてある。Experiment 3ではExperiment 2の手間とExperiment 1の分数による評価点という認知的負荷を組み合わせて、被験者により負担をかけるようにしている。

実際に追試結果を見てみると、Experiment 1ではGreater Effortで242.48,Lesser Effortで80.77と,Decision timeには大きな差があった一方で,Initial satisfactionはGreater Effortで6.51,Lesser Effortで6.37,またLikelihood-to-switchはGreater Effortで5.33,Lesser Effortで5.08と違いが見出されなかった。Experiment 2と3も同様の結果であった。なお統計方法についてはSavage-Dickey法が用いられている。以上から、Otto (2010) は努力の増加による満足度の上昇は見られず、また、より大きい認知的負荷を与えられた被験者で新しい商品に鞍替えする頻度の低下も起こらなかったと結論づけている。

このように、元研究と追試で正反対と言って良いほどの結果が出たが、これがどちらかの研究の誤りによるものなのか、それともまだ発見されていない人間の心理学的な要因によるものなのか、判別はつかない。強いて言うならば、追試の方が統計的な要素について言及しており、また実験手順についても詳細に述べていると言えると考えたため、信用度はこちらの方が高いと考えた。しかし、追試の方が信用度は高いとしても、この研究一つだけでは元研究の仮説が否定されたと言うには判断材料が足りなくあまりにも早計であるように思われた。やはり、何か正しいと言える理論を打ち立てるためには多角的な方面からの多数の知見が必要と言えるだろう。

心理学とは、漠然と人間の思考について研究、分析する学問と考えており、神経科学の進んだ昨今では、より生物学との結び付きから進展があったのではないかと考えていたが、このような事例を見て、対象を人間として扱うことの難易度に気付かされた。しかし、知見を積み上げて理論を作り上げていくという行為は科学のアプローチとして基本であり、失敗も知見のひとつであることを考えると、例え不正や誤りがあったとしてもこうして心理学としてのアプローチを行い人の思考を解き明かそうとし続けることはおおいに意義があると言うのが講義を受けての個人の所感である。

References
- Cunha, M., Jr, & Caldieraro, F. (2009). Sunk-cost effects on purely behavioral investments. Cognitive Science, 33(1), 105–113.
- Otto, A. R. (2010). Three attempts to replicate the behavioral sunk-cost effect: A note on Cunha and Caldieraro (2009). Cognitive Science, 34(8), 1379–1383.

ーーーーーーーーーー

ひとまずこんなとこで。たくさん章があるので好きなとこについて選んで書いてねと伝えてありました。そのトピックの周辺情報も調べてね,とも。書式についてはせっかく最近日心の手引きのWeb版ができたのでそっち見てとも伝えております。


この記事が気に入ったらサポートをしてみませんか?