■ 구글 딥마인드 알파고(AlphaGo)

 

▶ 알파고(AlphaGo)

 

알파고(영어: AlphaGo)는 구글 딥마인드가 개발한 인공지능(AI) 바둑 프로그램이다. 2015년 10월 판 후이 2단과의 5번기에서 모두 승리해 핸디캡(접바둑) 없이 호선(맞바둑)으로 프로 바둑 기사를 이긴 최초의 컴퓨터 바둑 프로그램이 되었다.

 

2016년 3월에는 세계 최상위 수준급의 프로 기사인 이세돌 9단과의 5번기 공개 대국에서 대부분의 예상을 깨고 최종전적 4승 1패로 승리해 현존 최고 AI로 등극하면서 세계를 놀라게 했다. 이 대국을 통해 인공지능의 새 장을 열었다는 평가를 받았으며, 바둑계는 기존의 통념을 깨뜨리는 창의적인 수와 대세관으로 수 천년 동안 이어진 패러다임이 바뀔 것으로 전망했다.

 

한국기원은 알파고가 정상의 프로기사 실력인 '입신'(入神)의 경지에 올랐다고 인정하고 프로 명예 단증(9단)을 수여했다. 딥마인드가 2014년 구글에 인수되면서 본격적인 개발에 착수한 알파고는 완성단계가 아닌 프로토타입 단계로 2016년 현재 개발이 진행중이다. 데알파고라는 이름은 구글의 지주회사 이름인 알파벳과, 그리스 문자의 첫 번째 글자로 최고를 의미하는 '알파(α)'와 '碁(바둑)'의 일본어 발음에서 유래한 영어 단어 'Go'를 뜻한다.

 

 

▶ 알파고 알고리즘

 

머신 러닝과 트리 순회 기술을 조합, 인간과 컴퓨터 모두와의 대규모의 연습과 결합한다. 이 알고리즘은 심층 신경망 기술로 구현한 '가치 네트워크'와 '정책 네트워크'에 인도되는 몬테카를로 트리 순회를 사용한다.

 

한정된 양의 게임 전용 특징 탐지 전처리로 신경망 입력을 만들어 낸다.[3] 최초에 시스템의 신경망은 인간의 게임 플레이 전문 기술로 부트스트랩되었다. 알파고는 처음에는 3천 만 수 정도의 데이터베이스를 사용, 기록된 역사적인 게임으로부터 기사(棋士)의 움직임의 연결을 시도, 인간의 바둑 두기를 흉내내도록 훈련되었다.

 

▶ 알파고 기풍

 

알파고는 응수타진이나 사석작전같은 소위 '인간적인' 전략을 능수능란하게 구사한다. 김명완 9단은 판 후이 2단과의 대국에서 알파고는 '사람 같다'고 묘사하였고, 경기 심판 토비 매닝은 프로그램의 방식을 '보수적'이라고 했다.

 

김성룡 9단은 이세돌 9단과의 5국을 해설하면서 “이창호 9단이 새로운 기풍으로 바둑계를 놀라게 했던 것과 비슷한 느낌이다. 계산의 신(神算)으로 불렸던 이창호 9단의 전성기와 닮아있다”라고 설명하였다.

 

알파고가 어느 정도 숙달되자, 강화 학습을 통하여 또 다른 자신과 많은 대국을 하게 하는 방식으로 훈련, 경기력을 향상시켰다.

 

+ Recent posts