見出し画像

【学習理論】オペラント条件付けとは?

動物行動学を考える上でのキーワード「オペラント条件付け」についてご紹介します。心理学でも有名なキーワードですが、犬のしつけでもよくこの手法を使うんですよ。知識として知るだけでなく、トレーニングにも活用できるようにしましょう!


誰が見つけたの?

まず、アメリカのソーンダイク(Edward L. Thorndike, 1874-1949)という心理学者が「猫の問題箱」という実験で、動物は人間のように仲間を模倣することはないとし、「偶然の成功を伴う試行錯誤」が、動物の学習の基本的な型であることを説いています。

↓は彼が行った実験を再現した動画ですが、この実験では、おなかをすかせた猫をボックスの中に入れて、餌を外に置いておきます。餌が食べたい猫はいろんなトライアル&エラーを繰り返し、偶然紐を引っ張ると扉が開くということを知ります。ここで重要なのは、何度か繰り返すと猫はこのボックスから出てくるのが早くなる、つまり何度も何度も、いろんな試行錯誤を繰り返すことで、誤りが減り正解に近づいてくる学習を行うということを発見したのです。


このソーンダイクの考え方をより発展させてオペラント条件付けを考えたのは、バラス・フレデリック・スキナー(Burrhus Frederic Skinner, 1904 - 1990)です。スキナーも同じく箱を使って実験を行いました。この箱にはレバーがついており、ネズミがそのレバーを押すと餌が出てくるようになってきました。この実験で、ネズミは「レバーを押すと餌が出てくる」ということを学習し、その行動を頻繁にとるようになったことが観察されました。つまり「動物にとってのご褒美」につながる行動が強化されたのです。

最初はソーンダイクが提唱するように、最初はいろんな試行錯誤をしていたら、たまたまレバーを押すと餌が出てきたのでしょう。ですが、その「餌が出てくる」というのがネズミにとって「ご褒美」であったため、再度そのご褒美をもらうために、何度も「レバーを押す」ようになり、レバーを押す行動が増えていったのです。

一方、例えば、このレバーを押すとき大きな音が鳴ったり、ビリビリ電気が走ったりしたらどうでしょう?もうレバーを押さなくなっていきますよね。つまり、嫌な結果を伴うのであれば、その行動は減っていきます

レバーという刺激に対して
餌が出る(ご褒美)=行動の発生頻度が増える
ビリビリ電気(嫌な結果)=行動の発生頻度が減る

という関係を見つけたのが、スキナー氏です。その実験の再現内容はこちら↓


オペラント条件付けって何?

刺激に対して、行動を起こし、結果がどうだったか、ということを動物は学習しているということです。

例えば、

刺激:オスワリというコマンド
  ↓
行動:犬が座る
  ↓
結果:おいしい食べ物がもらえる
  ↓
犬の気持ち:嬉しい!楽しい!おいしい!

という経験があったら、犬が同じ刺激に対して、同じ行動を取る頻度が高くなります。一方、同じ刺激、同じ行動をとったとしても、結果が犬にとって望ましくないものだったらどうなるでしょう?

刺激:オスワリというコマンド
  ↓
行動:犬が座る
  ↓
結果:怒られる、大きな騒音がした
  ↓
犬の気持ち:不安・・・

となったら、犬がその行動を取る頻度が低くなっていきます。

こうして、結果が犬にとって良いものか、悪いものかということで、行動は増えたり、減ったりします。この行動が増えることを強化と呼び、行動が減ることを弱化(罰)と呼びます。

言い換えると、行動を選ぶことで、結果を変えられるので、結果が良い=強化の学習が進み、結果が悪ければ弱化の学習が進みます。

このような「刺激⇨行動⇨結果」の連鎖を三項随伴性と呼び、この組み合わせに注目することで飼い主にとっても犬にとっても好ましい学習をさせていくというのが、トレーニングになります。

Tip
三項随伴性の各プロセスに分けて分析することを「ABC分析」と呼ぶこともあります。これは、先行条件(Antecedents)、行動(Behavior)、結果(Consequences)の頭文字をとっています。


強化子と弱化子とは?

行動が増えること=強化ですが、その行動が増えるような犬にとって嬉しい結果を「強化子」と呼びます。一方、行動が減ること=弱化ですので、行動が減るような犬にとっての嫌な結果を「弱化子(罰子)」と呼びます。

ご褒美はフード、遊び時間、散歩などを指すということを以前の記事でご紹介しました。嫌なことというのは何でしょうか?大きな音、特に金属音や車の低い音などの聴覚の嫌悪刺激、苦いという味覚の嫌悪刺激などがあります。こういう結果を伴うと、犬にとっては「あの行動をすると、こんなに嫌なことがある」となり、行動が減っていきます。

なお、ご褒美も犬の嫌がることも与えるだけではなく、取り上げることで逆の効果が期待できます。例えば・・・

①ご褒美を与える → 犬は喜ぶ → 行動が増える
②ご褒美を取り上げる → 犬は欲求不満を感じる → 行動を減らす

③嫌がるものを与える → 犬は恐怖不安を感じる → 行動を減らす
④嫌がるものを取り上げる → 犬は安堵する → 行動を増やす

これを区別するために「与えること」を「正」、「取り上げること」を「負」と呼んで区別します。表にするとこんな感じです。

コメント 2020-04-06 214201

犬がとった行動により、いまどんな結果がもたらされており、犬が喜んでいるのか、嫌がっているのかを観察することが重要です。しかもここで考えるのは、「犬がどう感じるか」ということです。飼い主がどう感じるか、他の犬がどう感じるか、は関係ないのです。洋服を着るのが好きなワンちゃんもいれば、嫌いなワンちゃんもいます。そうすると・・・

オスワリをしたら、洋服を着せられた → イヤ! → オスワリが減る
オスワリをしたら、洋服を着せられた → ハッピー! → オスワリが増える

と、同じオスワリという行動で、同じ洋服を着せられたという結果であっても、犬の受け取り方によって、行動が強化されたり、弱化されるのです。ここによく注意してください!


オペラント条件付けはどうやってトレーニングに使うの?

今までこの理論をベースに、正の弱化を中心にトレーニングが行われていました。いわゆる、ダメな行動をしたときに叱る、嫌がることをするというものですね。ですが、この方法には2個問題点があります。

まず一つ目は、嫌がる結果を与え続けると「不安」や「恐怖」というネガティブな感情を犬に呼び起こしますので、学習性無気力症を起こすリスクがあるのです。例えば、宿題を忘れたら廊下に立っていなさい、と先生に叱られ続けた結果、「もう勉強は無理!」となって廊下に出された瞬間、遊びに行っちゃうようなものですね。

二つ目は、不安や恐怖の程度が大きいと、闘争反応に出ることがあります。恐怖のあまりパニックになって飼い主を攻撃してしまうんですね。

このようなやり方に対して、今、注目されているのは、モチベーショントレーニングと呼ばれている正の強化を中心にした「褒める」トレーニングです。犬は嬉しい結果が待っているので、ワクワク楽しんでトレーニングを行うようになりますし、飼い主との信頼関係も築けるようになります。

ぜひトレーニングを行うときは、このオペラント条件付けの理論を理解したうえで、モチベーショントレーニングのやり方を採用してください。

Tip
悪いことをしたら正の弱化をしようするのではなく、まず無視するということをしてみてください。目線や声といったアテンションも向けません。ただ、決して正の弱化を使用してはいけないということではありません。きちんとリスクを理解したうえで、試してください。またあくまで、犬が嫌がることをする目的は「行動を減らすこと」です。行動が減らないにも関わらず、ずっと嫌がることをやるのは「虐待」と取られ兼ねませんので注意しましょう。

Q1:犬は、そのトレーニング方法で学習が進んでいますか?
Q2:犬が、身体的、精神的に活発にトレーニングを行っていますか?
Q3:そのトレーニング方法は犬にとって、公平ですか?

トレーニングを始める前に、この3つの質問を自問自答してみてくださいね。体罰はもちろんNGです!!


まとめ

オペラント条件付けでは、動物が行動した結果を学習することによって、その行動の頻度が変わることが示されています。

「オスワリ」というコマンド(刺激)に対して、犬は「座る」ことも「無視する」こともできますよね。でも、犬が「座ったらご褒美が出てくる」と知っていたら、積極的にオスワリをするようになるということです。

また、この学習が速やかに進ませるための強化スケジュールなどもあるのですが、記事が長くなってしまったので、別でまたご紹介いたしますね!

とにかく、褒めるとその行動が増える!ということをぜひ覚えて、実践してみてくださいね。


■Yokohama Dog Academyでは

このような学習理論、犬の心理学をもとにしたトレーニングおよび問題行動改善を行っています。問題行動修正、しつけ、なんて聞くと、とっても怖いしつけを想像される方がいらっしゃるのですが、実はワンちゃんもしっぽぶんぶんしながら、トレーニングをしていく方法があるんです。そんな方法を知りたい、やってみたいという方、お申込みはこちらから!お気軽にご質問ください。


この記事が参加している募集

私のイチオシ

この記事が気に入ったらサポートをしてみませんか?