学習行動 慣れ・刷り込み・古典条件付け・オペラント条件付け
学習とは、経験によって行動が変化し、その変化が比較的持続する現象です。慣れから複雑な問題解決まで、学習には多くの種類があります。パブロフの犬やスキナーの箱で知られる実験心理学の知見を、進化・生態的文脈とともに理解しましょう。
基本知識
慣れ(Habituation): 繰り返される無害な刺激に対して応答が徐々に弱まる最も単純な学習。例: 突然の音には驚くが繰り返されると反応が薄れる。適応的意義: 不要な刺激への反応コストを削減。
刷り込み(Imprinting / 刻印づけ): ローレンツが発見。生後初期の感受期(臨界期)にある特定の刺激に恒久的に影響される学習。例: ニシン鴎の雛は孵化後数時間以内に最初に見た動く物体を親として追う。逆向き刷り込みは成立しない(一方向性・不可逆性)。性的刷り込み(配偶者選択への影響)も重要。
古典的条件付け(パブロフ型条件付け): 無条件刺激(UCS)(食物)→無条件反応(UCR)(唾液分泌)のペアに、条件刺激(CS)(ベル音)を繰り返し先行させると、CS単独でも条件反応(CR)(唾液分泌)が生じるようになる。「刺激-刺激」の連合学習。消去=CSを単独で繰り返すとCRが弱まる。自発的回復・般化・分化も重要概念。
オペラント条件付け(道具的条件付け/スキナー型): 自発行動→結果の連合学習。正の強化=行動後に報酬→行動頻度増加。負の強化=嫌悪刺激の除去→行動頻度増加。罰=嫌悪刺激の付与→行動頻度減少。強化スケジュール(連続・部分強化)によって消去抵抗が異なる。
古典的条件付けとオペラント条件付けの違いを、パブロフの犬とスキナーの箱を例に比較しなさい。
解答: 古典的条件付け(パブロフ): 無条件刺激(食物)と条件刺激(ベル)を対提示する。動物は受動的で、既存の反射反応(唾液分泌)を新しい刺激に連合させる。「刺激→反応」の自動的な連合学習。オペラント条件付け(スキナー): ラットがレバーを押す(自発行動)と餌が出る(強化子)。動物は能動的に環境に作用する。行動の「結果」によって行動頻度が変化する「行動→結果」の学習。
- 慣れ=繰り返される無害刺激への応答減弱・最も単純
- 刷り込み=感受期・一方向性・不可逆・ローレンツ
- 古典的条件付け=UCS+CS→CR(刺激-刺激連合)
- オペラント条件付け=自発行動+強化子(行動-結果連合)
- 正の強化=報酬付与→行動増加
- 消去=条件刺激のみ繰り返すと条件反応が弱まる
- 感受期=特定の学習が起こりやすい限られた時期
注意点
① 「負の強化」は罰ではない。嫌悪刺激の「除去」によって行動を増やすことを指す。② 刷り込みは感受期に限定されており成立後は変更が困難な点が他の学習と異なる。③ 慣れは疲労や感覚順応とは異なる(適切な刺激なら応答が回復する)。
練習
- 刷り込みの特徴を「感受期」「不可逆性」の語を使って説明しなさい。
- パブロフの実験における無条件刺激・条件刺激・条件反応をそれぞれ答えなさい。
- オペラント条件付けにおける「正の強化」と「負の強化」の違いを例を挙げて説明しなさい。