“알파고가 ‘실수(mistake)’를 했다.”
구글 딥마인드 데미스 하사비스 최고경영자(CEO)는 13일 4번째 대국에서 알파고가 이세돌 9단에게 패한 뒤 자신의 트위터 계정에 이같이 언급했다. 인공지능(AI)은 인간처럼 생각하거나 판단하지 않는다. 그러므로 실수라는 것도 있을 수 없다. 그럼에도 하사비스 CEO가 실수라고 표현한 것은 알파고에도 허점이 있다는 걸 우회적으로 표현한 것이다.
이날 대국에서 알파고는 79수를 둘 때까지 자신의 승률이 70%라고 계산했다. 알파고의 심층 신경망에 있는 ‘가치망’이 계산한 확률이다. 알파고는 ‘정책망’이 가장 좋은 수를 찾고, ‘가치망’이 승률을 계산한다.
79수 이후에 알파고가 최선의 수를 찾는 데 오류를 일으켰거나 가치망이 승률 계산을 잘못했을 가능성은 없다.
그럼에도 승률이 계속 떨어진 것은 이 9단이 알파고의 수에 대응해 나가면서 알파고가 더 좋은 해답을 찾아내지 못했다는 의미로 해석할 수 있다. 하사비스 CEO는 “79수가 실수였으며 알파고가 이를 알아차린 건 87수가 됐을 때였다”고 설명했다.
알파고는 프로 바둑기사의 기보 3000만건 이상을 바탕으로 스스로 대국을 두며 학습하는 ‘머신러닝(기계학습)’을 통해 실력을 키워왔다.
사실상 모든 바둑기사가 두는 바둑의 경우의 수가 알파고에 입력돼 있고, 이를 바탕으로 대국을 펼치며 가장 좋은 수를 찾아나가는 훈련을 한 것이다. 이날 패배는 그동안 축적된 ‘경험’을 바탕으로 최적의 값을 찾는 알파고가 ‘창의성’을 바탕으로 한 이 9단의 바둑에 약점을 드러냈다는 것이 증명됐다.
이 9단은 대국 이후 “알파고가 백보다 흑을 힘들어하고, 자기가 생각하지 못한 수가 나오면 대처능력이 떨어진다”고 말했다. 알파고와 4차례 바둑을 두면서 패턴을 파악했다는 의미다. 15일 열리는 다섯 번째 대결에서도 알파고의 패턴은 그대로 유지될 가능성이 높다. 인간처럼 생각하는 게 아니라 계산에 따른 결론에 의지하기 때문이다.
하사비스 CEO는 대국 이후 기자간담회에서 “이 9단 덕분에 알파고의 허점을 파악할 수 있었다. 중앙에서 알파고가 많이 밀렸다. 이 과정에서 알파고의 한계가 노출됐으며 이는 매우 소중한 지식”이라고 말했다. 이어 “영국으로 돌아가서 기보를 더 면밀히 분석하고 여러 통계수치를 보면서 어떤 것이 문제가 됐는지 파악해 알파고의 실력을 높이겠다”고 덧붙였다. 알파고 개발자인 데이비드 실버 박사는 “항상 상대방이 최고의 수를 놓는다는 가정 하에 알파고는 승률을 극대화하기 위한 수를 계산한다”며 ‘방심’하지 않았음을 강조했다.
김준엽 기자 snoopy@kmib.co.kr
[관련기사 보기]
잇단 악수 왜 뒀을까… 알파고 실수? 이세돌 ‘창의적 手’에 치명적 약점
입력 2016-03-13 21:29