본문 바로가기

[IT&테크] IT 이야기

[특집] IT와 심리학 (인공지능에 사용되는 심리학에 대하여)(2/2)

본 글은 2019년에 군대에서 심리학 교양을 들으며 제출했던 레포트를, 블로그의 형식에 맞게 수정한 글 입니다.

이전기사 보기


앞으로의 인공지능과 심리학

 앞서 말한 인공지능들은 소임만 수행 할 수 있는 약 인공지능이다. 사람처럼 감정을 느끼고, 새로운 일을 배우고, 대회의 맥락을 파악할 수 있는, 한 가지 일에 국한되지 않는 인공지능을 강 인공지능이라고 한다. 나는 강 인공지능이 갖추어야 할 능력 중에서 물체지각 능력과 자연어를 통한 대화 능력에 관심을 가졌다. 이 두 가지 주제에서 심리학을 찾아보았다.


신호처리와 정신물리학

 외부의 물리적 자극에 의해  감각 기관이 외부의 물리적 자극을 전기적 신호의 한 형태인 활동 전위로 바꾸면, 신경을 통해 뇌까지 활동 전위가 전달된다. 이렇게 전달된 활동 전위는 뉴런의 말단에서 신경전달물질이 뇌 속으로 분비되도록 한다. 이 일련의 과정을 감각처리라고 한다. 환경 내의 사물을 인지하여  대뇌피질에 그 사물에 관한 전체상이 형성되면 ‘물체를 지각하였다’고 한다.

 인간은 감각 역치를 통해 감각을 느낀다. 감각 역치를 통한 감각인식의 방식은 절대역과 상대역으로 나눌 수 있다. 절대역은 탐지할 수 있는 에너지 수준과 탐지할 수 없는 에너지 수준 사이의 분할 점이다. 이는 특정 자극에 대한 민감성의 한계를 나타내며 외부환경을 인식하는 데 있어 관문이다. 절대역을 탐지확률이 50%인 자극강도로 정의한다. 반면 차이 역은 감각적으로 변별 가능한 최소한의 물리적 자극의 변화량을 의미한다. 보통 최소 가지 차(JND)로 나타낸다. 표준자극과 최소 가지 차의 비율은 상당히 안정된 상숫값을 가지며 이것을 베버의 법칙이라고 한다. 이는 탐지 자가 자극의 절대량보다는 상대적인 차이나 변화에 더 민감하다는 것을 보여준다.

 이와 비슷하게 기계는 입력장치를 통해 신호를 수신하여 신호를 여러 목적에 따라 가공하는 신호처리과정을 거친다. 신호는 아날로그 또는 디지털 신호로 표현되며, 음향, 전자기파, 영상 또는 센서 출력값 등 다양한 측정값을 표현할 수 있다. 대부분의 입력신호는 디지털로 이루어진다, 따라서 디지털 신호 처리를 통해  디지털화된 신호를 원하는 방향으로 정보 신호를 알고리즘에 의해 수치로 처리해야 한다. 이 단계에서 인간의 감각 인지 방식인 절대역, 차이 역에서 아이디어를 가져와 알고리즘을 구현한다면 인간과 유사한 감각인지 능력을 갖출 수 있을 것이다.

 디지털신호 처리는 연속적인 실세계 아날로그 신호를 측정하고 걸러내고 압축하는 것이다. 여기서 필요한 신호와 불필요한 신호를 판별할 때 신호탐지 이론을 적용할 수 있다. 신호탐지이론은 신호의 탐지가 신호에 대한 관찰자의 민감도와 관찰자의 반응 기준에 달려 있다는 이론이다. 이 이론은 신호(Signal)와 노이즈(Noise)를 구분하는 데 관련된 능력을 측정하는 수단으로 이용할 수 있다.  이러한 인간의 지각 방식을 알고리즘에 접목하여 한층 더 인간에 가까운 지각 능력을 얻게 될 수 있을 것이다.

 

인간의 신호탐지, https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%BC:SignalDetection.png

 


자연어 처리와 문화심리학

 마지막으로 인공지능과 심리학에 대한 자료를 수집하면서 흥미로운 기사를 발견하였다. 따라서 기사의 출처를 남기고 요약하여 수록 하였다.

 인공신경망의 발전으로 영상처리 분야에서 주목할 만한 결과가 나오면서 합성 곱 신경망(CNN)이 인공지능의 큰 부분으로 인식되곤 하지만 인공지능의 발전을 이끈 또 하나의 축은 기호(Symbol) 기반의 인공지능이다. 언어는 인간의 의식에서 벌어지는 상징물들의 조작이고 상징이다. 이에 기반해 기호를 처리하는 기호 주의 인공지능이 자연어 처리 분야를 오랫동안 이끌어 왔다.

 자연어 처리 연구는 순환신경망을 적용했다는 한계로 인해 큰 벽을 넘지 못했다. 그러나 2018년 10월 구글이 발표한 대화형 인공지능 언어 (BERT)가 발표되면서 인간의 언어 이해 능력 이상의 결과를 보인다. BERT는 학습 속도의 향상할 수 있도록 병렬처리형 범용 딥러닝 모듈 아키텍처인 ‘Transformer’를 양방향으로 설계하고 있다. 이러한 구조와 더불어 언어사용자의 중요한 단어에 집중해 의도와 문맥 분석에 집중하는 범용 관심 모델을 채택했다. 이 관심 모델은 기본적으로 언어심리학에 기반한 것으로 발화 의도와 문맥 분석에 집중한 것이다.

 예를들어, ‘커피 더 마실래?’라고 할 때 서양에서는 ‘more coffee?’라고 하지만 동양에서는 ‘더 마실래?’라고 다르게 대화하는 것이다. 서양에서는 명사(coffee)를 중심으로 생각하고 동양에서는 동사(마실 것)를 중심으로 생각하는 차이에서 기인한다고 볼 수 있다. 따라서 맥락을 파악하여 구현하는 모델에서는 동서양의 언어 차이가 나타나는 양태를 다른 방식으로 구현해야 한다.

대화의 중요한 특성 중의 하나가 서양의 대화는 상대방에게 정보를 제공하는 관점이 반영된다는 것이다. 이에 반하여 동양에서는 상태를 통제하고 제어하려는 의도(맥락)에 숨어 있다. 상대방에게 대화하는 만큼의 에너지를 투여하는 것에 상응하는 통제적 요소가 반영될 때 나의 에너지 투여에 가치가 있는 것이라는 관념이 깔린 것이다. 따라서 대화에는 숨은 의도에서 맥락의 기본적인 차이가 존재한다. 이처럼 동서양의 문화 심리적으로 나타나는 언어의 차이는 공학적 인공지능만으로는 현대의 인공지능 기술을 따라가기 어려운 점을 설명해준다. 따라서 심리학자나 심리철학자가 IT 개발 팀에 있어야 발전하는 인공지능의 수준을 높여 컴퓨터 기술자들 만 있었을 때 얻을 수 없었던 새로운 방법론을 찾아낼 수 있을 것이다.


결론

 심리학의 이해를 수강하면서 인공지능의 원리에도 심리학이 사용됨을 알게 되었다. 따라서 인공지능과 심리학이라는 주제를 잡고, 인공지능 알고리즘에 내포된 심리학적 원리를 조사하며 앞으로 나아가야 할 인공지능의 방향에 대해 심리학을 접목해 보았다. 이 과정에서 중요한 시사점을 발견할 수 있었다.

 공학을 전공하더라도 인문학에 소홀히 해서는 안 된다는 것이다. 공학은 사람을 이롭게 하기 위해 공업적인 생산에 응용하여 생산력과 생산품의 성능을 향상·발전시키는 학문이다. 최종적으로 ‘인간’을 위한 결과물을 산출해야 하며 그러기 위해선 ‘인간’ 인간의 근원 문제, 사상과 문화에 관해 탐구해야 한다. 그것을 깨닫는 것이 인문학이며 나는 인문학과 자연과학 중심에 서 있는 심리학을 공부했던 것이다.

 특히 인간의 지능을 모방하는 ‘인공지능’을 연구하고 싶은 입장에서 심리학을 공부해야 하는 것은 필연적일지도 모른다. 이번 리포트를 통해, AI에 필요한 심리학이 무엇인지 알게 되었고 심리학을 좀 더 심화하여 공부하여야겠다고 생각하게 되었다.


참고자료

1.딥러닝 위키피디아

https://ko.wikipedia.org/wiki/%EB%94%A5_%EB%9F%AC%EB%8B%9D

2.  이재용 IT+심리학 | 인공지능에서 유용한 사회문화심리학(발췌 요약)

 http://www.ciokorea.com/news/122678

3. Martin Heller | InfoWorld "알파고를 만든" 강화 학습 이해하기

http://www.itworld.co.kr/news/124052#csidx0287b9c3269bd7b9628749cbb9acd6a

4.시그마프레스 | 일상생활의 심리학

5. 홍릉과학출판사 | 4차 산업시대의 컴퓨터학개론

6.  IT Cookbook 한빛 교재 시리즈 | 디지털 신호 처리