조회수 4488
작성자 윤은영
제목 알파고가 작동하는 원리
등록일 2016-03-18

알파고가 지난 간 자리는 강렬한 흔적을 남겼다. 그런데 텔레비전 대담 프로그램이나 미디어에 등장하는 인공지능에 대한 논의는 전부 컴퓨터 공학적인 차원에서 이루어지고 있다. 인공지능은 인간의 뇌의 인지처리 과정과 연결될 수밖에 없는데 어느 누구도 제대로 건드리지 않는다. 알파고가 지나치게 과장되어 찬양 일색이거나, 기존에 있던 알고리즘의 결합에 지나지 않는다는 폄훼 사이에서 극단적 평가를 받고 있다. 그래서 내가 좀 더 이야기 해보기로 했다.

 

인공지능의 가장 기본적인 개념은 단순 기계적 계산에서 벗어나서 인간의 뇌에서 일어나는 인지 처리 방식을 응용하여 계산적 부담을 줄이는 동시에 인간의 행동 모방이 가능하도록 설계하는 것이다. 알파고의 경우 바둑돌이 놓일 때마다 모든 경우의 수를 계산해서 판단한다면 계산적으로 엄청난 부담이 된다. 그렇다면 알파고와 같은 인공지능을 개발하는 사람들은 당연히 경우의 수를 줄일 수 있는 방법을 생각하게 된다. 계산할 범위를 좁히게 되면 이길 수 있는 수를 판단하고 피드백 하는데 드는 부담을 줄일 수 있다.

 

계산 범위를 좁힐 수 있는 가장 효율적인 방법은 무엇일까? 여기서 우리는 허사비스의 인터뷰를 살펴봐야 한다. 허사비스의 인터뷰에 등장하는 가장 핵심적인 단어 중 하나가 바로 패턴인식이다. 우리는 사람의 얼굴과 사물을 구별한다. 인간의 이러한 학습 능력은 경험에서 비롯된다. 또한 경험으로 학습된 뇌는 사람의 얼굴, 고양이, 개의 얼굴 패턴에서 미묘한 차이를 인식하고 구별할 줄 알게 된다. 이러한 패턴 인식이 가능한 신경망을 허사비스는 알파고에 적용하여 계산의 부담을 줄이고 바둑 매치에서 승리의 확률을 올린 것이다.

 

허사비스와 연구팀은 전문 바둑 기사들이 두는 바둑 형태를 알파고에 학습시키고 알파고 자체 게임을 통해 신경망을 강화학습 시켰다. 이렇게 하면 신경망 층과 층 사이에 강한 연결성을 가진 신경은 더욱 강해지게 된다 (이는 신경 연결의 weights (가중치)의 변화로 나타난다). 또한 자신이 판단한 돌의 위치나 상대의 돌의 위치가 몰고 올 결과를 예측하여 수의 가치를 추정하도록 훈련시켰다. 현 상황에서 승률이 제일 높은 위치를 판단하기 위해서이다. 이러한 훈련을 통해 알파고는 바둑을 익혔다. 알파고의 신경망은 모든 경우의 수를 다 고려하여 학습하기 보다는 흰 돌과 검은 돌의 대결 구도 패턴에서 최적의 자리를 찾는 방식을 사용한다. 패턴인식 능력이 있는 신경망을 응용했기 때문에 가능한 일이다. 결론적으로 알파고는 현재 흰 돌과 검은 돌이 만든 집 형태에서 이기는 수를 판단하여 승리를 확보한다. 이러한 논리는 알파고가 많은 집 차이로 이기기보다 적은 집 차이지만 승리를 하도록 훈련되었다는 것을 의미한다.

 

허사비스가 바둑을 택한 이유는 직관적인 게임이기 때문이라고 말했다. 알파고가 이런 직관이 필요한 과제를 훈련하고 수행할 수 있다는 사실은 인공지능의 발달 단계를 높일 수 있다. 물론 통찰력, 직관, 창의성이 어떠한 형식으로 정의되는지에 따라 달리 표현할 수 있지만 알파고는 인공지능의 적용 분야가 넓어질 수 있다는 사실을 정확하게 보여주었다. 알파고의 이러한 학습 형태는 비단 바둑에만 국한되는 것이 아니다. 아직 범용학습기계는 가야할 길이 멀다 하지만 알파고의 작동 원리는 충분히 많은 분야에 적용될 수 있고 빠르게 발전할 수 있다는 사실을 우리는 알아야 한다.