Skinner의 조작적 조건형성 (operant conditioning)

카테고리 없음

by 뜌뜌뜌뜌뜌 2023. 5. 12. 23:48

728x90

Burhus F. Skinner(1904-1990)는 Watson의 고전적 조건형성 이론을 확장시켜 어떤 행동을 한 후 뒤따르는 결과에 따라서 이후에 그 행동을 되풀이할지 여부가 결정된다는 조작적 조건형성을 주장하였습니다. 이때 조작이란 유기체가 스스로 시작하는 행동을 의미합니다.

1. 생애
Skinner는 1904년 미국 펜실베이니아에서 태어났는데, 그는 따뜻하고 안정된 분위기에서 행복한 어린 시절을
보내면서 여러 가지 도구를 직접 만들어서 갖고 놀거나 글쓰기를 즐겨했습니다. 변호사인 아버지는 아들이 법률가
가 되기를 기대했으나, 그는 국문학을 공부하기 위해 해밀턴 대학교에 진학하여 전문적인 작가가 되고자 했습니다. 대학교 4학년 때는 시인 Robert Frost를 소개받아 자신이 쓴 글들을 보냈는데 Frost로부터 계속 돈을 써보라는 격려 편지를 받기도 하였습니다. Skinner는 대학 졸업 후 2년간 글쓰기에 몰두했지만, 자신이 위대한 작가가 될 것이라고 여기지는 않았습니다. 그 후 Skinner는 심리학을 공부하기 위하여 하버드 대학교 대학원에 진학하였고, 학부에서 심리학을 수강했던 적이 없었던 만큼 더욱 열심히 노력 하였습니다.
Skinner는 실험실에서 자신이 고안한 장치를 가지고 학습에 관한 실험을 했습니다.
박사학위를 받은 후에는 미네소타 대학교, 인디애나 대학교, 하버드 대학교의 심리학과에서 재직하며 연구와 이론 정립에 힘썼습니다. Skinner는 심리학에서 큰 업적을 남기면서도 한편으로는 문학에 대한 관심을 버리지 않았는데, 자신이 실험실
연구에서 밝힌 강화의 원리에 기초하여 유토피아적인 사회를 그린 'Walden Two' (1948)라는 소설을 저술하기도 하였습니다. Skinner는 20세기의 가장 영향력 있는 심리학자들 중 한 명으로서 미국심리학회 등으로부터 많은 상을 수상했습니다. 그는 1990년 백혈병으로 세상을 떠났습니다.

2. 조작적 조건형성의 원리
Skinner는 Watson이 주창한 급진적 행동주의에 비해 좀 더 유연한 입장을 취했습니다. 그는 사고와 내적 경험의 실재를 부정하지 않았고, 인간행동이 나타나는 내적인 원인을 알아보고자 시도하였습니다. 자극과 반응의 연합으로 비롯되는 고전적 조건형성과는 달리 조작적 조건형성은 유기체가 자발적으로 하는 행동에서 비롯됩니다. 다시 말해, 고전적 조건형성에서는 환경이 개인의 반사적인 행동에 대해 일방적인 영향을 미치지만, 조작적 조건형성에서는 개인과 환경이 상호작용합니다. 따라서 인간의 행동은 환경 속에서 변화를 이끌며, 환경의 변화는 인간의 행동에 영향을 미칩니다.
조작적 조건형성은 Skinner가 고안한 'Skinner 상자' 속에 갇힌 실험용 쥐의 행동을 통해 설명될 수 있습니다. 이 장치를 통해 쥐의 조작적인 반응을 쉽게 관찰할 수 있었고, 쥐가 지렛대 누르기와 같은 특정 반응을 할 때 이러한 행동이 자동적으로
기록되었습니다.

쥐는 상자 속에서 발톱으로 긁고, 냄새 맡고, 이로 갉는 등의 행동을 하였는데, 이러한 행동들 중에서 특정 행동이 긍정적인 결과를 가져오느냐 부정적인 결과를 가져오느냐에 따라 그 행동이 다시 나타날지 여부가 결정되었습니다.
만약 지렛대 누르기 행동이 먹이라는 긍정적인 반응을 얻게 한다는 것을 알게 되면 쥐는 지렛대 누르기를 반복할 것입니다. 그러나 이와는 대조적으로 지렛대 누르기 행동이 전기 충격과 같은 부정적 반응을 일으킨다는 것을 알게 되면 쥐는
지렛대 누르기를 중단할 것입니다.
이처럼 행동의 결과는 강화와 벌을 수반할 수 있는데 행동을 한 후에 뒤따르는 결과가 행동의 빈도를 증가시키는 것을 강화라고 하고, 행동의 빈도를 감소시키 는 것을 벌이라고 합니다. Skinner는 인간의 행동이 음식물이나 칭찬과 같은 보상
에 의해서 증가되거나 비난, 무관심과 같은 벌에 의해 감소될 수 있다는 것을 증명하였습니다.

3.학습의 원리
(1) 강화(reinforcement)
강화는 정적(positive) 강화와 부적(negative) 강화로 나누어집니다. 정적 강화의 경우 행동을 하면 보상이 제공되기 때문에 그 행동이 증가합니다. Skinner 상자 속의 쥐가 지렛대를 누를 때마다 먹이를 제공받은 결과 지렛대를 더 빈번하게 누르게 되는 것, 시험공부를 열심히 한 결과 A학점을 받은 학생이 이후의 시험에서 열심히공부하려고 노력하는 것이 성적 강화에 해당됩니다. 먹이나 학점과 같이 강화를 일으키는 자극을 정적 강화인(reinforcer)이라고 하는데 먹이처럼 선천적인 반응을 보이게 만드는 강화인을 일차적 강화인이라 하고, 학점이나 칭찬, 돈과 같이 그것의 가치가 학습된 이후에야 효과를 가지는 강화인을 이차적 강화인이라 합니다.
한편, 부적 강화의 경우 행동을 함으로써 부정적인 자극이 감소되거나 제거되기 때문에 그 행동이 증가합니다. Skinner 상자 속의 쥐가 줄을 잡아당김으로써 전기 충격을 중단시킨 결과 줄을 더 빈번하게 당기게 되는 것, 휴식을 통해 두통을
해소할 수 있었던 사람이 이후에 또 다시 두통을 느낄 때 휴식을 취하고자 하는것이 부적 강화에 해당됩니다.

이 경우 줄과 휴식은 부적 강화인입니다.

(2) 벌(punishment)
벌은 원치 않는 행동을 제거하는 데 사용된다. 별은 정적 벌과 부적 별로 나누어집니다. 정적 벌은 행동을 한 결과 부정적 자극이 제공되기 때문에 그 행동이 감소합니다. Skinner 상자 속의 쥐가 지렛대를 누를 때마다 전기 충격을 제공받은 결
과 지렛대를 누르지 않게 되는 것, 동생을 놀려시 어머니로부터 야단맞은 아이가 동생을 놀리지 않게 되는 것이 성적 벌에 해당합니다.
또, 부적 벌의 경우 행동을 하면 긍정적인 자극이 줄어들거나 제거되기 때문에 그 행동이 감소합니다. 수업 시간에 떠들어서 시험 점수를 감점 당한 학생이 이후의 수업 시간에서는 조용히 하는 것이 부적 벌에 해당됩게 됩니다.
부모나 교사는 아동의 부적절한 행동이 나타나는 빈도를 감소시키기 위해서 벌을 빈번하게 사용하는데, 그러나 벌의 효과는 다음과 같은 몇 가지 이유들로 인해 한계가 있습니다(Burger, 2004).

첫째, 벌은 적절한 행동을 가르치지 못하며 단지 바람직하지 못한 행동의 빈도만 감소시킬 수 있습니다. 다른 아동들을 때리는 아동을 단순히 벌하기보다는 좌절감을 주는 상황에 대처하는 대안적인 방법을 학습하도록 도와주는 것이 더욱 좋습니다.
둘째, 벌은 즉각적이고 일관성 있게 주어질 때 보다 효과적입니다. 어머니는 "아빠가 오시면 혼내 주라고 할 거야"라고 말하는 대신 이동의 문제 행동을 가능한 즉각적으로 벌을 주어야 한다. 이때 벌의 강도는 적절해야 하며, 바람직하지 않은
행동이 일어날 때마다 일관성 있게 주어야 합니다. 예를 들어, 아동의 '나쁜 말버릇에 대해 때로는 벌을 주었다가도 또 다른 상황에서는 그냥 내버려 두는 방식으로 할 적으로 벌을 주게 되면 아동의 나쁜 습관을 개선시키는 것이 불가능할 수 있습니다.
셋째, 부모는 이동의 특정 행동을 억제시키기 위해 벌을 줄지 모르지만, 아동은 벌을 다른 행동과 연합시킬 수 있습니다. 예를 들어, 장난감으로 바닥을 심하게 두드려 큰 소음을 내는 아동에게 엉덩이를 찰싹 때림으로써 두드리는 행동을 못하도
록 할 수 있습니다. 그러나 이때 고전적 조건형성이 이루어져 아동이 벌을 통해 경험하는 공포나 불안과 같은 부정적인 감정을 벌을 주는 사람과 연합시킬 수 있습니다.

넷째, 벌은 모방 학습될 수 있다. 엉덩이를 맞은 아동은 이를 신체적 공격성이 용인될 수 있다는 신호로 받아들일 수도 있습니다.
다섯째, 벌은 바람직하지 못한 행동을 적절하고 바람직한 행동으로 대체하는방법을 학습시키지는 못합니다. 벌은 바람직하지 않은 행동을 일시적으로 억제하는 데만 효과가 있습니다. 심지어 벌은 강화로 전환되기도 합니다. 예를 들어, 교사가 수입시간에 장난치는 학생을 다른 학생들 앞에서 공개적으로 비난하는 정적 벌은 그 학생으로 하여금 다른 학생들로부터 주의를 얻도록 하기 때문에 이후에 같은 행동을 반복하게 만드는 결과를 가져와 실제로는 정적 강화로 작용할 수 있습니다.
부적 강화와 벌은 둘 다 부정적인 것이지만 행동에 미치는 효과에는 큰 차이가 있습니다. 강화는 정적 강화이든 부적 강화이든 행동의 빈도를 증가시키지만, 벌은 정적 벌과 부적 벌 모두 행동의 빈도를 감소시키는 결과를 가져옵니다.

(3) 소거(extinction)
강화를 중단함으로써 행동의 빈도를 감소시켜 궁극적으로 행동의 발생을 억제 시키는 것을 소거라고 합니다. 소거는 바람직하지 않은 행동을 없애는 가장 효과적인 방법입니다. Skinner 상자 속의 쥐가 지렛대를 눌러도 먹이가 제공되지 않으면
쥐는 지렛대를 누르지 않게 되며, 교사가 수업 시간에 장난치는 학생을 복도에 나가 있게 함으로써 학생의 주의를 끌만한 자극으로부터 격리시키면 장난을 멈추게 할 수 있습니다.

강화, 벌, 소기의 적용 방법 및 적용의 결과를 요약하면 다음과 같습니다
표 조작적 조건형성의 절차

(4) 조형(shaping)
강화를 통해 이미 습득된 행동의 빈도를 증가시킬 수는 있지만 아직 습득되지 않은 행동을 강화시키는 것은 불가능합니다. 조형은 현재 나타내고 있는 어떤 행동을 궁극적으로 습득시키고자 하는 행동에 점진적으로 근접하도록 강화를 주는 것
입니다. 실험자는 Skinner 상자에서 쥐가 받을 약간 들어 올려 지렛대를 누르는 것과 유사한 모습을 나타낼 때 강화를 줄 수 있습니다. 반응이 강화되면 쥐가 다리를 들어 올리는 빈도가 증가합니다. 실험자는 점진적으로 원하는 행동과 더 유사한 반응을 요구합니다. 이러한 방법을 사용함으로써 이전에는 나타나지 않았던 반응이 보다 빈번하게 일어나도록 만들 수 있습니다.

(5) 연쇄(chaining)
연속적인 일련의 행동 또한 조작적인 조건형성을 이용하여 만들 수 있습니다. 예를 들어, 책읽기를 지도하기 위하여 도서관과 같이 책이 많은 곳으로 데려가서, 책의 표지를 관찰하도록 하고, 책을 펼쳐보도록 하고, 책을 읽을 때 격려해
일련의 행동들을 순차적으로 수행하도록 하여 적응적 행동들을 학습시킬 수 있습니다.

(6) 변별(discrimination)
자극들 간의 차이를 지각하여 표적 자극에 반응하는 것을 변별이라고 합니다.
Skinner가 비둘기에게 불빛을 비추었을 때는 먹이를 주고 불빛을 비추지 않을 때는 먹이를 주지 않은 결과 비둘기는 변별자극인 불빛이 있을 때만 쪼아대는 행동을 하였습니다.
변별은 인간의 행동에서 빈번하게 일어난다. 운전을 할 때 경찰을 보면 더 천천히 운전하거나 신호를 지키려고 하고, 물건을 사러 가게에 갔을 때 'Sale'이라는 글자를 보면 더 많이 사게 됩니다. 또, 사회적으로 성숙한 성인은 언제 말을 하고 언제
침묵을 지켜야 하는지를 압니다. 이처럼 변별자극에 대한 반응은 적응 행동의 중요한 측면입니다.

(7) 일반화(generalization)
변별자극과 유사한 자극들에 대해서도 특정 반응을 하는 것을 일반화라고 합니다. 변별자극과 유사할수록 행동이 일어나기가 더 쉽습니다. 때때로 운전자는 경찰차와 유사한 형태의 차량을 보고도 긴장하며, 경찰관의 옷을 입힌 마네킹을 보고 차량의 속도를 줄이기도 합니다.