エラーの修正
誰しも間違いを犯すことはあります。心理学者スーザン・フリードマンは、「自然観測にみられる進化的改善のように、間違いは行動改善を生み出すものです」と述べています。間違いは悪いものとして消去するのではなく、間違いから学び修正することで、より良いものを生み出していくという考え方です。
「失敗は成功の元」という格言は、失敗することを奨励しているわけではなく、失敗から学び正しく修正していくことで成功に繋がることを示唆しています。動物のトレーニングでもしかり。トレーニングを成功に導くためには、エラーが出た時の対処はとても重要になってきます。
ストレスを生む修正方法
動物が間違いを犯した時の対処法として昔から、体罰や嫌悪刺激を与える「罰」が使われてきました。倫理的なトレーニングが謳われている現在でも、この方法はなかなか姿を消すことなく、誰しもが安易に使っているようです。
体罰を使わないプロのトレーナーでも、タイムアウトやNRM(無報酬マーカー Non Reward Maker)を使うことで、動物に間違いを知らせる方法を使っています。タイムアウトやNRMは一見すればエラーに対するフィードバックのように見えますが、正解の見えないタイムアウトやNRMは動物にストレスを与えることになり、これらも嫌悪刺激となりえるのです。
最小限のストレスを考慮したNRS
最もストレスをかけないエラーの修正方法として、シーワールドでイルカの訓練に携わるトレーナーたちによって考案されたのがNRS(Least Reinforcing Scenario 最小強化シナリオ)です。NRSは、望ましくない行動や基準に満たない行動の強化を避ける為のオプションであり、かつ、学習者をイライラさせずに次に移るシグナルとして使用され、トレーナー自信もNRSを瞬時に使うことにより迷いやストレスを感じずトレーニングを続行できます。
LRSとタイムアウトの違い
LRSは、すでに習得している行動のキューに対してエラーが出た時に、トレーナーがアイコンタクトを取りながら、2~3秒のポーズを取ることです。望ましくない反応の後にトレーナーが取る、固定された、あるいはあらかじめ決められた姿勢の事ではありません。これだけでは、ごく短時間のタイムアウトのように見えますが、
タイムアウトには明確な時間の長さが特定されていない
タイムアウト後のに何をするのか指定されていない
など、LRSとは大きな違いがあります。LRSは2〜3秒(もっと短い時もある)で、その後も学習者がトレーナーに集中を維持している事に、もしくは集中を確認した直後にだしたキューに反応することで強化子を与えるところまでを含みます。これは、タイムアウトが負の弱化であるのに対し、LRSはリセットであり強化子の出る行動の導くことを目的としているのです。
他行動分化強化との違い
LRSの後半だけを取ると、問題行動が生起していないことに対して強化的な刺激を随伴させる手続き「他行動分化強化(DRO;Differential Reinforcement of Other Behavior)」に似ているように見えますが、LRSは問題行動の消去のための手法ではなく、あくまでも「すでに習得している行動のキューに対してエラーが出た時」に瞬時に対応する手法であり分化強化とは全く別のものです。
原理は普遍、適用方は変わる
LRSで最も大事なのは、学習者のトレーニングへの集中力が持続していることです。その集中力が途切れていないこと、そして途切れさせないことがトレーニングを続行できる鍵となり、強化するに値する行動でもあります。
エラーの修正はLRS以外にもたくさんの方法があります。
ストレスを感じさせない
集中力を切らせない
望ましくな行動に強化子を出さない
等の基本原則を守れば、方法は何を選んでもいいし、状況によってベストの方法を行使できるようにいくつもの切り札を持っておいてもいいかもしれません。
トレーナーは教え手になるため、その原理も手法も明確に定義付け使用できるようになっておく必要がありますが、極端な話、一般飼い主にはエラーの修正方法を教えるよりは、学び手の集中力を切らさないためにも、エラーを無視してすぐに次の行動に移るように指導することもあります。型にこだわり過ぎて、大事なことを見落とさないためにも。そして必要ならば、録画で後日解説する等のフィードバックで良いのではないでしょうか。
参考:Karen Pryor Academy ライブエピソード#38
最小強化シナリオLRSの概念