6.学習心理学

1.Premackプリマックの原理(強化の相対性原理)

反応生起確率がより高い反応は、より低い反応を強化することができるという原理で、プリマックにより提唱された。Premackは、「強化行動」(例えば、飲む、食べる、遊ぶ等)と「強化可能な行動」(たとえばキーを押す、走る、レバーを押すなど)との間の随伴性として強化をとらえる方が適切であると主張した。強化子と強化可能な反応の絶対的カテゴリーは存在せず、ある行動がどちらの役割を果たすかは確率スケール上における相対的な位置に依存する。のどの乾いた動物にとって強化子とは,水ではなく飲水行動であり,子供にとって強化子とは,おもちゃではなくおもちゃで遊ぶ行動なのである。逆に、「より生起確率が低い行動は,より生起確率が高い行動を罰する」ことになる。

2.反応形成(シェイピング)

オペラント条件付けにおいて用いられる技法。新しい行動を獲得させるために、目標をスモールステップに分け、達成が容易なものから順に形成していく方法。成功させるには標的行動を明確化する、すでに達成できている行動を確認し、シェイピングする行動を選択して強化する(分化強化)、適切なステップサイズを設定するなどが考えられる。強化によってその反応とそれに類似した反応の自発頻度が高まるので(反応般化)、いったん強化を消去する。すると新しい反応が自発されるようになる。逐次的接近法ともよばれる。

3.消去バースト

消去直後に見られる急激な反応頻度の増加と反応強度の増加。

4.般化勾配

標準刺激とテスト刺激に対して条件反応がどの程度出現するかを表したもの。縦軸を反応率、横軸を刺激の量や価値の程度をとる形でグラフを描いた場合、強化した特定の刺激を頂点にして、刺激の類似度が低くなると次第に反応率が減少していく逆V字型になる。

5.反応制限説

アリソンとティンバーレイクが提唱。より制限された反応A(反応生起率が制限された行動)は、より制限が少ない反応B(反応生起率がAよりは制限されていない行動)を強化することができる。条件付けの場面では何かしらの反応が制限されるためである。摂水反応と走行反応を等しい時間だけ行っているラットに、水を10秒飲めば3秒だけかごの中で走行できるようにすると、普段以上に摂水しなければ走行にかける時間が減ってしまうので、より水を飲むようになる。実際、走行を制限するとラットの水飲み量は増加する。

6.要求低減説

ハルが提唱。一次性強化刺激(食餌、水、暖かさ、痛みの回避)はすべて生物学的要求を満たすもので、その刺激は強化子の役目を果たす。また、それぞれに対応する生理的メカニズムが存在する。しかし、性や人工甘味料などは強力な強化子となるが、生物学的な機能は備えない強化子(なくても死なない)である。この原理に対する多くの例外があるため、この原理は不適切である。

7.動因低減説

ハルが要求低減説の問題を認めて、新たに提唱。空腹などの内的な欠乏状態を欲求、欲求が満たされていない内的状態を動因(飢餓動因、性動因など)といい、動機づけは動因を減らそうとする力であるとする説。いかなる種類の強い刺激作用も生体にとって嫌悪的であり、このような刺激作用のどのような低減も、ただちに直前の行動に対する強化子の役割を果たす。問題点として①刺激作用の強度の客観的測定が簡単ではない、②強化子が刺激作用を低減しない、あるいは増加させるという例外があることである。

8.場面間転移性の原理

メールPaul Meehlが提唱。ある刺激をオペラント反応に付随して与えたときに、そのオペラント反応の生起率を高めたならば、この刺激を別のオペラント反応に付随して与えた場合も、必ずそのオペラント反応の生起率を高めることができるとする説。しかし、その例外をプリマックが始めて示した。(→プリマックの原理へ)

9.トークンエコノミー

適切な反応に対してトークン(代用貨幣)を与え、目的行動の生起頻度を高める行動療法の技法。トークンは一定量に達すると特定物品との交換や、特定の行動が許されるという二次的強化の機能を果たす。

10.強化スケジュールについて

強化スケジュールとは、オペラント行動と強化のされ方の関係を表したものである。反応の度に強化することを連続強化といい、それ以外を部分強化という。部分強化には①定比率強化②変動比率強化③定間隔強化④変間隔強化の4つがある。①はx回に1回必ず強化し、強化直後は反応が起きなくなる(強化後反応休止)。②は平均してx回に1回になるように強化する。強化の有無によらず反応が生起し、消去抵抗が強い。③はx分(秒)に1回強化する。強化の時間が近づいたときに行動が多くなる。④は平均してx分(秒)に1回になるように強化するもので、行動はコンスタントに続く。理論的には連続強化の方が行動生起率が上がるが、実際は部分強化の方が消去抵抗が強いハンフリーズ効果が知られている。

11.ハンフリーズ効果(強化矛盾・部分強化効果)

理論的には連続強化スケジュールの方が部分強化スケジュールよりも連合が強まり消去されやすいはずなのに、実際には部分強化スケジュールの方が消去抵抗が高い現象のこと。ハンフリーズにより提唱。

12.罰の行動対比

ある弁別刺激には反応を罰するが、他の弁別刺激では罰を与えない条件付けを行うと、罰が与えられない弁別刺激では逆に反応が増加すること。

13.種に固有な高度に準備された学習

環境への適合性を高めるために必要なため、非常に少ない回数で連合形成される学習。非常に選択的であり、連合の消去はかなり困難。刷り込みや味覚嫌悪学習など。

14.ガルシア効果(味覚嫌悪学習)

味覚刺激やにおい刺激のあるもの(CS)を摂取したあと、塩化リチウム溶液を投与し、吐き気や腹痛(US)を起こすことで、最初に摂取したものを嫌いになるという条件付け。ガルシアにより発見。

15.脱制止

消去後に、条件刺激呈示直前に新奇刺激を提示すると、一次的に条件反応が出現する現象。パブロフにより発見。

16.高原現象(プラトー現象)

知識学習や技術学習をするときに、その上達の程度を示す学習曲線は一直線に伸びていくわけではなく、停滞して上達のスピードが落ちることがある。学習時間をどれだけ延長しても、学習効果があがらなくなる現象をいう。その原因として①内発的動機づけの低下、②単純作業の反復による集中力や思考力の低下、③身体的疲労や精神的ストレス④学習方法への不適応⑤学習目的の喪失が挙げられる。

17.認知地図

トールマンが、試行錯誤学習と洞察学習を統合した理論で、環境に存在する手がかりをもとに、形成された心的な構造である認知地図を作成し、最適な解決策を選択できるという考えである。、刺激S-反応Rの間に媒介概念を考え、「場所学習」か「反応学習」かをネズミの迷路実験で検討した。その結果、場所学習の方が速く達成水準に到達した。これは、ネズミが迷路を探索中にS-Rを学習したのではなく、餌を得るためにどこに餌があるかという全体としての布置を学習したと考え、そのような内的表象を認知地図と名付けた。この認知地図の利用によってなされると考察したのが潜在学習である。

18.潜在学習

行動の遂行には直接現れることはないものの、潜在的に内的に処理される学習のことで、トールマンが提唱した。トールマンはここから、サイン・ゲシュタルト説を提唱し、学習はS-Rの結合ではなく、ある刺激と意味のある目標対象との手段ー目的関係の結びつき、すなわちいかなる信号がいかなる意味を持つかを認知することだと述べた。サインが与えられると、これに基づいて目標対象へ向けた行動が生起するのである。

19.試行錯誤

正反応と誤反応を繰り返すことで、学習が成立することを、試行錯誤学習といい、ソーンダイクが問題箱の実験で見出した。試行錯誤学習はS=Rの連合学習で、動物や人間の学習を最もよく特徴づける。正しい結合が生ずる条件を示す法則が「効果の法則」である。これは、満足や快状態をもたらす効果のある行動は生起しやすくなり、反対に嫌なものや不快なものをもたらすような行動の場合には状況との結合が弱められる。一般に、試行錯誤学習を繰り返すことで、S-Rの結びつきが徐々に強くなり、問題解決にかかる時間は短くなっていく。この法則が、オペラント条件付けのもとになっている。

20.洞察学習

ゲシュタルト心理学のケーラーが、チンパンジーの実験で発見した概念。試行錯誤のように何回も繰り返すのではなく、問題解決という目的に沿って、過去経験などをもとにその場の状況を再構成し、ひらめきによって一気に解決への見通しを立てる問題解決方略。洞察とは、問題の構成要素間の関係や構造、因果関係、手段ー目的関係などに関する、認知的枠組みをもたらすこと。突如現れる非連続的な問題解決方法であり、連続的な過程である試行錯誤とは対照的である。

21.移行学習

特定の刺激を手掛かりとする弁別学習を行ったのち、別の手がかりによる弁別学習を行うこと。①逆転移行と②非逆転移行がある。たとえば、はじめは図形の色を手掛かりとして、黒い図形が正解、白い図形が不正解とする学習を行う。そのあと、逆転移行学習では、白い図形が正解、黒い図形が不正解になる。非逆転移行学習では、色の手がかりではなく、大きさを手掛かりとし、大きい図形が正解、小さい図形が不正解、という学習である。ケンドラー夫妻の実験では、年少児は非逆転移行、年長児は逆転移行の方が容易であることがわかった。

22.言語的媒介理論

大人が提供する文化的道具である言語が、子どものうちに内言化され、思考の媒介機能を果たすとした考え方で、Kendler夫妻により発見された。子どもと環境との相互作用には、大人の媒介的活動が不可欠であるとしている。

23.有意味受容学習

学習する内容を、学習者がすでに持っている認知構造に関連付けて学習させること。はじめに教える包括的抽象的概念を、先行オーガナイザーといい、学ばせたい知識を整理したり対象づけたりする目的で、当該知識に先行して提供する。先行オーガナイザーは、事前に対象の概略情報を提供する説明オーガナイザーと、既有の知識と対比や重ね合わせを行う比較オーガナイザーという2つの手法に分類される。

24.水路づけ

ジャネットが提唱した概念である。ある欲求を満たす手段がいくつかあり、そのいずれも選択できる場合に、たまたま選択したある手段が欲求を満たしてくれると、次から次第に欲求とその手段が連結し、固定化するようになること。

25.鋭敏化

刺激の繰り返し呈示によって、その後、刺激に対する生得的反応が増大すること。馴化の逆。一般に、提示される刺激が強いと鋭敏化、弱いと馴化が生じる。また、鋭敏化は初期の試行で生じやすい。鋭敏化の特徴は、馴化のように刺激特定性を示さないことである。刺激特定性とは、学習した刺激に特定的で、別の刺激には反応しないということである。

26.二重過程説

グローブスとトンプソンによる。刺激の繰り返し呈示によって、鋭敏化と馴化の2つのプロセスが並行して生じるとする。鋭敏化は強い刺激によって引き起こされる一般的な興奮状態であり、刺激の繰り返しによって増大し、その後正常な状態に復帰する。逆に馴化プロセスは、反応が繰り返し生じることを抑制しようとする傾向である。実際に観察される反応はこの2つのプロセスが合成された結果であり、提示される刺激が強い場合には、提示回数に伴ってまう反応が増大してからやや減弱するという経過を示し、刺激が弱い場合には反応の単調現象がみられることになる。

27.迷信行動

たまたま時間的に接近して生起した行動と反応が、偶然強化されて、反応の自発頻度が高まること。特に、道具的条件づけにおいて、反応と強化の間にある程度時間が空くと、その強化をもたらした反応が何であるかが明瞭でなくなるために、偶然、強化の直前に生起した別の行動の生起率が上がるのである。スキナーが提唱。運動選手が試合前に必ずあるものを食べるなど。スタッドンとジンメルハグはハトに餌を呈示する実験でこれを実証した。一方、人に見られる迷信行動は、社会的・文化的要素が強い。

28.ルール志向(支配)行動

ルールとは強化随伴性についての言語的記述である。サルに円と四角形の図形を呈示し、一方の図形を選択したら餌を与える弁別学習をさせ、これが完成したら、異なる図形のセットに移行し、再び弁別学習を行わせる。これを繰り返していくと、「一つの図形を選択しても餌が出なければ、別の図形を選択すればいい」という規則に従って学習できる。このような規則に従って行われる行動をルール支配行動という。ルールは他の個体との共有が可能である。ヒトは言語を媒介して、多数のルールを共有することで、きわめて多様な行動の連鎖を形成する。人間は直接自分で強化随伴性を経験しなくとも、他者から与えられたルールを手掛かり(弁別刺激)として適切な行動を起こすことができる。たとえば、「学食の定食はおいしい」と聞いて、はじめて学食を食べるという行動をしたら、それはルール志向行動である。

29.ミラーニューロン

マカクザルの脳の特定の部位に電極を刺し、行為と関連する脳の電気活動を記録する研究を行っているときに発見された。餌をつかみ取ろうとするときに活動する神経の細胞の一部が、他のマカクザルや人間が餌をつかみ取ろうとするときにも同様に活動することが見いだされ、生物における模倣という行為を可能にしている神経細胞と考えられている。人間の場合はサルのように神経細胞を特定できないので「ミラーニューロンシステム」と表現される。人間は他者の行動もしくは感情を理解することができるということが、ミラーニューロンシステムの本質として主張されている。

30.モーガンの公準について

動物心理学者モーガンが提唱したもので、「試行錯誤学習のような低次の心的な能力によって、説明可能なことは、推理や統合のような高次の心的能力によって解釈してはならない」という比較心理学における原則を示した。モーガンは、比較解剖学者のロマーニズが、動物行動の研究において逸話法を用いて、人間と動物の心的能力に大きな差異はないと主張したことに対し、過剰な擬人主義だと批判して、これを主張した。モーガンの公準により、動物の擬人的解釈が排された。

31.間接強化

直接褒められるよりも、第三者から間接的にほめられる方が、利害関係が感じられず真実性があるので強化されるという現象。

32.暗黙の強化

ほめたい人と比較対象になる人をけなすと、けなされていない人は、自分自身について相対的にほめられているような気がすること。

33.オペラント条件付けの訓練

反応に随伴して与える刺激の種類と、提示条件によって、①報酬、②オミッション、③罰、④逃避/回避に分けられる。①は決められた反応をしたときに報酬を与える訓練で、反応率は上昇する。この手続きを正の強化という。②は決められた反応をすると報酬を除去する訓練で、反応率は低下する。③は決められた反応をすると嫌悪刺激を与える訓練で、反応率は低下する。罰の強度が強いほど反応を抑制する効果が大きい。ある弁別刺激の下では反応を罰するが、他の刺激の下では罰しないと、与えられない刺激の下では反応が増加したり、罰を中止すると以前より反応が増えるという「罰の行動対比」が起きることがある。④は嫌悪刺激に対して決められた逃避反応をすると、嫌悪刺激を除去する訓練である。この手続きを負の強化という。

34.運動学習

運動技能を習得すること。簡単で単独の技能に関する学習を経て、全体的な技能のまとまりを形成する。練習が重要で、集中学習よりも分散学習の方が効率的。また、結果のフィードバック(結果の知識)と遂行のフィードバック(遂行の知識)が重要である。ハッチェは、標的の前に立って右足をあげてできるだけ標的を蹴り上げてもらうという実験を行った。120試行目まで結果のフィードバックを与え続けると、蹴り上げるまでの時間が短くなっていった。そのあと遂行のフィードバックを行ったところ、それ以降の試行ではさらに遂行時間が短くなった。