教師あり学習と強化学習の違いはどこにあるのか

教師あり学習

教師あり学習では、あらかじめ答え(正解ラベル)が付与された問題を大量に学習させ、新たな問題が入力された時に答えを出力できるようにする。

強化学習

なんらかの選択をさせ、その行動に対する評価(報酬)を与え、評価が大きくなるような行動の仕方を学習させる。「教師あり学習」の答え(正解ラベル)と異なり、報酬はある一つの行動に対して即座に与えられる必要はなく、状況に応じて、何度かの行動を行った結果に対して、与えられる形でかまいません。

これらの説明は機械学習の一つの側面です。

ただ、正解に対する考え方が異なります。




学習の目的

伝統的教育においては、生徒の学業の中に含まれている目的を構成するさいに、生徒が積極的に協力をすることが保障されていない

ジョン・デユーイ『経験と教育』

この意味合いは、歩くという行動は、地面に立つことによってのみ初めて実行に移されます。ありふれた環境のもとで私たちは、たいした注意を払ってはいません。

たとえば人跡のない険しくでこぼこな山を登るような、困難な名状し難い状況のもとでは、そこにみられる条件がどのようなものであるかについて、極めて注意深く観察しなければならなくなる。

ジョン・デユーイ『経験と教育』


茂木健一郎さん、ひろゆきさん、サトママさんでされていた議論「ChatGPTは12歳未満禁止をすべきか?」の三人三様の主張を聞いて、自分なりに考えてみました。

そして、この例があったか…と思い出し、マルクス・ガブリエルの著書『新時代に生きる「道徳哲学」―自分の自由を手放さないために—』を開いてみました。

その例というのは…

そこにバナナがある。

という状況です。

私が空腹の場合、空腹を満たしてくれるバナナは、手を合わせ「いただきます」と感謝を伝えたくなる存在となるでしょう。もし私が空腹でなければ、バナナがあっても「そこにバナナがある」と視界に入ってくるかこないか、そのくらいの存在になるでしょう。

私たち人間が物理的に実在する物にかかわるとき、すでに思想のレベルが関与しているのです。

新時代に生きる「道徳哲学」


マルクス・ガブリエルさんが参考にしている哲学者、ハンス=ゲオルク・ガダマーの言葉は

他者が正しい可能性はある

新時代に生きる「道徳哲学」

「相手が正しい」でも「自分が間違っている」でもありません。
ただ単に「相手の観点を、感情も含めて考慮する必要がある」ということです。

新時代に生きる「道徳哲学」


私個人としては、子どもが大学生くらいまで育ち、時間に余裕がある親御さんたちは、若い人達の言葉に真摯に耳を傾け、もう一度、社会の状況を観察し学び直す必要があるのではないか…と感じています。