본문 바로가기

[IT&테크] IT 이야기

[특집] IT와 심리학 (인공지능에 사용되는 심리학에 대하여)(1/2)

 본 글은 2019년에 군대에서 심리학 교양을 들으며 제출했던 레포트를, 블로그의 형식에 맞게 수정한 글 입니다.


 나는 전자공학부에 재학중인 학생으로서 인공지능으로 진학을 희망하고 있다. “공학뿐만이 아니라 다양한 학문에 관심을 가지고 공부하는 자세를 지녀야 인간에게 도움이 되는 공학도가 될 수 있다”는 아버지의 말씀에 따라 군대에서 심리학의 이해를  수강하였다. 상기 강의를 수강하면서, 사람의 지능을 모방하는 인공지능은 인간의 정신을 탐구하는 심리학과 밀접하게 관련되어있음을 알 수 있었다.

 따라서 자신의 전공과 심리학을 연관 지어 과제물을 제출하라는 추가과제물에서, 현재의 인공지능에서 사용되는 심리학을 발견하고, 미래의 인공지능이 나아가는 데 필요한 심리학을 ‘심리학의 이해’에서 배운 내용에서 생각해보았다.


현재의 인공지능과 심리학

4차산업혁명 시대에 발맞추어 인공지능은 급속히 발전하고 있다. 딥마인드의 바둑 인공지능 알파고, IBM의 의료 인공지능 왓슨, 신경망기술을 접목한 구글 번역기와 네이버의 파파고까지 인공지능은 이미 다양한 분야에서 일상 속에 스며들었다. 인공지능을 이루는 알고리즘이 발견되고 그 알고리즘에 따라 자료를 분석하고 처리할 수 있는 정보처리능력이 발전하면서 가능해진 일이다. 나는 인공지능에서 자주 쓰이는 딥러닝에서 심리학을 발견하였고, 알파고의 강화학습에 관해 강의에서 배운 내용을 찾아보았다.


딥러닝과 발달이론

 딥러닝은 여러 비선형 변환기법의 조합을 통해 높은 수준의 추상화를 시도하는 기계학습 알고리즘의 집합이며, 큰 틀에서 사람의 사고방식을 컴퓨터에 가르치는 기계학습의 한 분야라고 이야기할 수 있다. 이러한 딥 러닝은  뇌 발달과 밀접한 관련이 있다

 발달이론에서 사람의 뇌는 출생 이후 시냅스 가지치기가 이루어진다.  뇌는 우선 많은 시냅스를 만들어 두었다가, 사용하지 않는 시냅스를 없애고 사용하는 시냅스의 효율을 조절하는 방식으로 발달한다. 다양한 학습 역학이 결국은 서로 연관된 신경망들의 자기 조직화를 도와준다는 특징이 있다. 뇌에서 한 층의 조직이 먼저 성숙하고 다른 부분과 순차적으로 연결되는 방식으로 전체 뇌가 성숙할 때까지 반복된다.

시냅스 가지치기, https://m.post.naver.com/viewer/postView.nhn?volumeNo=16634267&memberNo=22718804

 이 시냅스 가지치기는 딥 러닝 모델에서도 활용된다. 인공신경망의 계층적인 필터 구조(각 동작 환경에서 필요한 정보만 걸러내는 다중 계층 구조)가 실제 뇌의 피질과 유사해 보이게 되었다. 이러한 과정을 통해 자기 조직적인 변환기의 계층구조가 만들어지고 각 환경에 맞도록 조율된다.

합성곱 신경망의 구조(계층적 구조), https://news.unist.ac.kr/kor/column_202/

 인간의 인식 발달 및 진화와 관련하여 딥 러닝의 중요성은 많은 과학자의 관심을 끌고 있다. 인간의 경우 뇌가 발달하는 중요한 시기이며, 세상 밖의 훨씬 더 복잡한 경험에 노출될 수 있다. 이러한 현상은 인간이 빠르게 변화하는 환경에 더 잘 적응할 수 있도록 만든다. 적응의 정도는 대뇌 피질 발달에 반영되기도 하고, 또한 두뇌의 자기 조직화 시기에 자극적인 환경으로부터의 정보 추출에 변화를 준다. 딥 러닝의 이런 이론들은 결국 인간 진화의 기본적인 조건으로서 문화와 인식의 공진화를 보여준다.


강화학습과 스키너의 조작적 조건형성

 이러한 앞서 말했던 알파고 또한 딥러닝을 이용한 인공지능이다. 특히 알파고는 이때까지의 인공지능과 달리 스스로 강화학습을 통해 스스로 발전했다.

 먼저 스키너의 조작적 조건학습에 관해서 설명하겠다. 유기체의 조작적 조건학습은 행동주의 심리학의 이론으로서, 어떤 반응에 대해 선택적으로 보상함으로써 그 반응이 일어날 확률을 증가시키거나 감소시키는 방법을 말한다.  행동의 결과를 통해 보상이 주어진다면 그 행동을 더 자주 하게 된다고 보았고, 그 보상을 ‘강화물’이라고 한다. 쾌락 제공뿐 아니라 혐오 제거로도 유기체를 강화할 수 있는데, 전자를 정적 강화, 후자를 부적 강화라고 한다.

 인공지능에서 강화 학습은 일부 가치를 극대화하는 방식으로 행위자(actor) 또는 에이전트(agent)를 학습 시켜 환경에 응답한다. 환경 또는 학습 알고리즘은 에이전트 보상 또는 벌칙을 전송해 강화를 실현한다. 이것이 정책을 수정할 수 있고 정책의 수정이 곧 학습을 형성한다. 이해를 돕기 위해 구체적으로 살펴보자. 알파고는 바둑(환경)을 두는(행위) 방법을 학습하기 위해 먼저 대량의 과거 바둑 기보를 통해 인간 바둑 기사들을 모방 학습했다(예비 학습). 그런 다음 독립적인 자기 자신의 인스턴스를 상대로 수없이 바둑을 두면서 시행착오를 거쳐 경기력을 개선했다(강화 학습). 인간의 학습법을 인공지능에 접목한 사례인 것이다.

 

다음 기사에 계속,,,