본문 바로가기

정보처리, 학습, 인지 발달 이론, 교육 이론

스키너의 학습심리학과 관련 용어 정리

스키너의 학습 심리학과 관련 용어 정리

스키너의 학습 심리학과 관련 용어 정리
스키너의 학습 심리학과 관련 용어 정리

고전적 조건 형성의 원리와는 조금 다른 여러 가지 주요 개념들이 있어요. 먼저 말씀드린 강화. 강화는 일반적인 영어 동사는 strengthen인데요. 심리학적인 용어로는 reinforcement라는 용어를 써서 그야말로 강력하게 만드는 것이 강화입니다. 무엇을? 행동을 더 강하게 만드는 거죠. 혹은 자주 하게 만드는 거죠. 그래서 그때 쓰이는 물건이나 기재를 강화인 또는 강화물이라고 합니다. 강화의 반대는 벌이예요. 어떤 식의 반대냐 하면, 강화는 행동을 강력하게 혹은 더 자주 하게 하는 거라면, 벌은 그 행동을 약화시키거나 없애주는 거라서 반대의 개념입니다. 강화에는 정적 강화와 부적 강화가 있고 처벌에는 제거성 벌과 수여성 벌이 있습니다. 두 가지, 두 가지 조합을 해서 네 가지를 기억을 하셔야 되는데요. 학생들이 많이 헷갈리는 게 부적 강화와 벌입니다. 제가 꼭 짚어드리면, 강화라는 말이 들어가면 여러분이 negative 말 때문에 헷갈리시는데요. 정적이든 부적이든 강화는 무조건 행동을 증가시키는 것인데, 그 기재가 조금 다른 것이 정적 강화는 학습자가 혹은 유기체가 좋아하는 자극을 제공하는 겁니다. 뭘 주는 거죠, 행동한 다음에. 강화는 결과물이기 때문에 행동 뒤에 주는 게 핵심이에요. 그래서 제가 만든 말 중에 학생들이 하도 헷갈려해서 사후 강화라는 말을 만들어서 수업 시간에 씁니다. 강화라는 말 자체에 이미 행동 뒤에 주어진다는 의미가 들어있는데, 행동하기 전에 무슨 행동을 유발하기 위해서 물건을 준다. 그건 강화 아니에요. 행동은 어떤 자발적 행동이 있고 나서 그 결과로써 주어지는 게 강화인 거죠. 그래서 어떤 행동을 했을 때 그 행동을 또 하게 하기 위해서 유기체가 좋아하는 자극을 줄 때가 정적 강화입니다.

부적 강화

그에 비해서 부적 강화는 행동을 증가시키는 목적은 똑같아요. 더 그 행동을 자주 하게끔 하는 목적은 같은데, 방법이 어떤 싫어하는 것을 면하게 해 주거나 혐오 자극을 제거해줘서 그 상황으로부터 면제시키거나 탈피시켜줘서 그 행동을 자꾸만 시키도록 하는 거죠. 정적 강화의 가장 대표적인 예는 용돈을 주거나 간식을 주거나 칭찬을 하거나 이런 선호하는 것을 주는 겁니다. 부적 강화의 가장 대표적인 건 뭘까요? 아이들이, 학습자들이 싫어하는 것을 안 하게 해 주면서. 예를 들면 청소를 잘하면 혹은 약속을 잘 지키면, 숙제를 다 해놓으면 그다음에 어떤 결과를 주는 거죠? 하기 싫어하는 걸 하나 빼주는 거죠. '너는 주번이 면제야.' 요즘도 주번이 있나요? '당번이 면제야. ' 혹은 '너는 청소 당번에서 일주일 동안 면해줄게. ' 이런 겁니다. 학생들이 하기 싫어하는 것을 안 하도록 해줌으로써 어떤 행동을 더 잘하게 하는 거죠. 어떤 학기에 강의실 수업에서 저한테 '교수님, 그러면 좋은 행동을 더 잘하기 위해서 무조건 강화를 쓰면 되고 나쁜 행동을 안 하게 하려면 무조건 벌을 쓰면 되나요?' 이런 질문을 한 적이 있는데요. 여기에서 교육심리학과 일반심리학의 차이가 있어요. 강화, 벌이라고 하는 것은 우리가 교육적으로 활용하기 때문에 좋은 행동에는 강화, 나쁜 행동을 감소시킬 때는 벌. 맞습니다. 맞는 얘기인데, 강화와 벌 기재 자체는 중립적인 것. 어떤 가치를 가지고 있지 않아서 그냥 타깃 행동, 목적 행동이라고 하죠. 목표 행동을 증가시키고 싶을 때는 강화를, 목표 행동을 감소시키고자 할 때는 벌을 쓴다. 이렇게 설명을 하는 게 더 정확한 답변입니다. 다만, 우리가 교육심리학적으로 강화와 벌을 사용하기 때문에 굳이 나쁜 행동을 증가시킬 필요는 없는 거죠. 그 점에 유의하시고요. 어떤 조직에서는 영화에서 그런 예를 들 수 있겠는데, 조직폭력배가 나오는 영화 같은 데서는 조직 폭력배 원들을 모집해서 사람을 죽이거나 나쁜 짓을 하는 행동을 가르치잖아요. 그럴 때 '야, 너 참 잘한다. 너 주먹 잘 쓰는데?'라고 하면서 막 칭찬을 합니다. 이거는 사회적으로 나쁜 행위고 통용되지 않는 것이지만, 그 행동을 더 잘하게, 도둑질을 더 잘하게 한다든지 살인을 더 잘하는 사람을 칭찬한다든지. 범죄 조직에서는요. 이런 것들이 가능하잖아요. 그래서 강화와 벌을 이해하실 때 심리학적인 기재로써는 가치중립적인. 어떤 목표 행동을 증가시키느냐 감소시키느냐고 이해하시면 좋겠어요. 그래서 정적 강화와 부적 강화 말씀드렸습니다.

벌의 종류

벌은 반대로 수요성 벌, 제거성 벌. 다른 이름으로 1종 벌, 2종 벌. 또는 1종 벌의 대표적인 예가 처벌이고요. punishment. 그리고 2종 벌의 대표적인 예가 time-out, 생략 기법이어서 이런 용어를 쓰기도 합니다. 1종 벌. 뭘 주는 벌이죠. 어떤 거요? 벌이니까 혐오 자극을 제공합니다. 언제요? 어떤 행동을 했을 때. 그 행동을 감소시키기 위해서. 그 다음 번에는 그 행동을 하지 말았으면 좋겠다는 의미로 벌을 주는 것. 1종 벌을 주는 것. 체벌을 한다든지 '손들고 서 있어' 이런 거 다 처벌에 해당됩니다. 2종 벌에 해당하는 time-out 기법은 time out, 시간을 정해놓고 뭘 못하게 하는 거예요. 선호 자극을, 좋아하는 자극을 제거하는 거기 때문에 요즘 아이들한테 가장 잘 먹히는 time-out 기법은 아마 스마트폰 사용 금지, 게임 일주일 동안 금지. 이런 거 하면 아이들의 행동 수정이 바로 일어날 걸요. 어떤 행동을 잘못했을 때 '너 스마트폰 일주일 동안 압수야' 이러면 '엄마, 잘못했어요. 다시는 안 그럴게요. ' 하면서 행동 수정이 바로 일어납니다. 너무 좋아하는 거기 때문에 그걸 제거했을 때 상황이 상상이 안 되는 거죠. 그래서 선호 자극을 주느냐 빼느냐 혐오 자극을 주느냐 빼느냐. 이 네 가지 차원으로 해서 강화는 정적, 부적. 벌은 1종, 2종 이렇게 나누어서 설명드렸습니다.

강화 계획

또 하나 중요한 개념이 강화 계획이라는 용어인데요. 어떤 행동을 만들어가는 과정에서 예를 들면 심부름을 안 하는 아이한테 심부름을 하면 500원을 줘요. 돈을 주는 게 좋은 강화는 아니지만, 예를 들면. 그래서 심부름 500원, 심부름 500원 이렇게 주는데, 그럼 계속 500원을 줄 거냐? 그럴 수 없죠. 우리가 이런 행동주의적 기법에서 강화를 쓰는 것은 초기에 행동을 조형하기 위해서 만드는 것이고요. 나중에 점점 강화를 줄여가는 것이죠. 그래서 어떻게 그러면 500원을 처음에 주다가 갑자기 안 주면 심부름도 갑자기 안 하게 돼요. 그래서 좀 과학적인 방법을 쓰는 거죠. 그러한 방법이 강화 계획입니다. reinforcement schedule이라고 해서 강화 계획은 크게 두 가지로 행동을 했을 때마다 계속 주는 연속 강화 또는 지속 강화라고 하는 방법이 있고요. 이제 그거에서 연속 강화를 처음에는 쓰다가 간헐적 강화로 바꿔주는 게 중요합니다. 가끔만 주는 거죠. 간헐적 강화는 보시는 것처럼 간격을 기준으로 하느냐 비율을 가지고 기준으로 하느냐. 또 하나는 고정시켜놓느냐 변동시켜놓느냐에 따라서 고정 간격, 변동 간격, 고정 비율, 변동 비율. 이렇게 나눌 수 있습니다. 고정 간격은 예를 들면 10분에 한 번씩 강화를 주는 거예요. 혹은 일주일에 한 번씩. 매주 수요일은 강화를 받는 날. 이런 거죠. 우리가 군대나 학교에서 포상을 하는 것도 이런 단위로 하잖아요. 매달 한 달에 한 번 언제 이런 식으로. 고정 간격의 문제는 그래프에서 보시는 것처럼 강화가 주어지기 직전에 행동 빈도가 쫙 올라가요. 그래서 물결무늬를 이렇게 그리죠. 처음에 예를 들면 매주 수요일에 상을 받는 날이다. 착한 아이에게 상을 주는 날이다. 이런 교실 규칙을 정해놨다면, 아이들의 행동 패턴을 관찰해 보면, 월요일 오후부터 착한 일을 막 찾아서 합니다. 그러면서 수요일 오전에 급격히 늘어나고 수요일 오후에 누군가 한 명 상을 받으면 착한 일을 하는 전체적인 행동 빈도는 쫙 줄었다가 다시 일주일이 지나가면서 다음 주 한 금요일, 월요일쯤 되면서 서서히 늘어가는 거죠. 이게 고정 간격. 예측이 가능하다는 문제점이 있어서 고정 간격은 어린아이들한테만 통용이 되고요. 변동 간격은 평균 일주일에 한 번은 한 번인데, 어느 날은 화요일, 어느 날은 수요일. 그래서 예측하지 못하도록 하는 겁니다. 그래서 강화 계획에서 간격이라는 용어가 들어가면, 시간을 기준으로 얘기한다는 거. 두 번째, 비율을 가지고 얘기하면 횟수예요. 예를 들어서 엄마가 '50분 동안 공부해. 그러면 50분마다 간식을 줄게. ' 이런 강화책을 쓴다고 하면, 방에서 50분 동안 아무것도 안 하고 있어도 50분 후에 강화가 옵니다. 간식이 옵니다. 이런 건 효율적이지 않죠. 그래서 차라리 이럴 때는 수학 문제 20개를 풀어놓으면 혹은 연습 문제 몇 쪽을 풀어놓으면, 몇 번이죠. 몇 회. '이걸 해놓으면 상을 줄게' 이런 식으로 강화 계획을 잡는 것이 비율의 문제예요. 그 횟수를 고정했을 때 고정 비율, 평균적인 횟수는 있지만, 어떨 때는 세 번에 한 번, 어떨 때는 일곱 번에 한 번. 이렇게 자꾸 왔다 갔다 변동시키는 것을 변동 비율이라고 얘기합니다. 강화 계획을 좀 잘 응용하셔야 행동의 변화가 성공적으로 이루어져요. 아이들의 행동은 쉽게 변하지 않습니다. 이미 고착화된 행동이거나 이미 고정된 행동은 특히 잘 변하지 않아요. 처음부터 만들어가는 행동도 쉽지 않은데, 개 한 마리를 바꾸기에도 쉽지 않은데, 아이들의 행동은 훨씬 더 어렵습니다. 그래서 선생님들이나 부모들이 많이 이런 얘기를 하죠. '강화 이론 알고 나서 제가 적용해 봤는데, 잘 안 되더라고요. 강화해봤자 강화 안 주면 끝이고요. ' 강화 계획을 잘 못 쓰기 때문이에요. 계속 연속 강화만 쓰다가 간헐적 강화로 옮겨지지 않고 간헐적 강화도 고정 간격만 쓰다가 점점 변동으로 옮기지 않았기, 변화 주지 않았기 때문에 행동 패턴이 익숙해져서 강화의 효과가, 즉 강화의 효과성이 떨어지는 거죠. 강화에도 내성이 생기기 때문입니다.

조형

그다음에 영어로는 shaping, 조형이라고 하는 단어인데요. 행동을 만들어가는 겁니다. 의도한 행동에 근접한 행동을 강화함으로써 새로운 행동을 완전하게 만들어가는 것을 조형, 조성이라고 합니다. shaping인데요. 핵심은 점진적으로 접근해가는 거예요. 이 조형을 설명할 때 여러분, 동물의 서커스나 돌고래 쇼 같은 거 생각하시면 아주 좋은데요. 어떻게 그런 돌고래들이 쇼를 잘하게 됐는지. 조형해 가는 거죠. 물에서 놀고 있다가 우연히 뛰어나왔을 때 먹이를 주는 거죠. 그때 휘슬을 같이 분다든지 어떤 규칙들을 이용해서 하나. 하나, 두 개. 하나, 두 개, 세 개. 어떤 행동들을 점점 고리를 만들어갑니다. 이걸 chaining, 연쇄라고 하는데요. 그 연쇄를 통해서 점진적으로 행동을 늘여나가고 또 우연한 행동을 했을 때 강화를 줌으로써 점점 그 행동을 만들어가는 과정을 조형이라고 얘기합니다. 우리는 이런 조형의 원리를 통해서 없던 행동, 못하던 행동, 하지 않았던 행동을 만들어가고 있는 거죠. 그리고 선행 자극은 행동에 영향을 미치는 행동에 앞서는 자극. 아까 고전적 조건 형성으로 설명하면, 음식을 주기 전에 종을 친다든지 이런 것들이 선행 자극이 될 거고요. 여기 강화 이론으로 얘기하면, 강화가 일어나기 전에 단서가 되는 어떤 환경적인 사태 혹은 사건 이런 것들이 선행 자극으로 기능을 하게 됩니다. 그래서 고전적 조건 형성에 이어서 조작적 조건 형성의 주요한 개념들을 설명드렸습니다.