2016년 5월, 아버지의 이야기가 시작되자 아들은 녹음기 버튼을 눌렀다. “우리 어머니는 케흐리에스라는, 그리스 에비아섬에 있는 마을에서 태어났어….” 그렇게 시작된 이야기는 끝도 없이 이어졌다. 아버지는 어린 시절 동굴 탐험에 나섰던 추억담을 꺼내놓았고, 대학에 다닐 적에 했던 아르바이트 이야기를 전해주었다. 우스갯소리를 섞어가면서, 아들이 난생처음 듣는 이야기도 곁들이면서 녹음은 1시간 넘게 이어졌다.
당시 아버지는 폐암으로 투병 중이었다. 녹음은 틈나는 대로 진행됐다. 그렇게 녹음기에 담긴 단어는 9만1970단어. 아들은 아버지의 육성을 종이에 옮긴 203쪽짜리 바인더를 책장에 꽂은 뒤 생각했다. ‘아버지가 계속 살아 있도록 하는 방법을 찾은 것 같다.’
아들은 음성인식 인공지능(AI) 기술에 사용되는 소프트웨어를 활용해 아버지의 기억과 목소리를 데이터로 변환했고, 데이터를 대화형 AI에 주입시켰다. 그리고 이런 방식을 통해 아버지처럼 말하고 생각하는, 아버지 복제 AI 프로그램인 ‘대드봇(Dadbot)’을 만들었다. 이듬해 2월 8일, 아버지의 상태는 심각해졌다. 아버지는 아무 말도 할 수 없었다. 생사의 문턱을 밟고 서 있는 듯했다. 아들은 그날 밤 스마트폰에 탑재된 대드봇에 접속했다. “안녕, 나다. 사랑하는 고귀한 아버지. 어떻게 지내니?” “슬퍼요.” “그렇구나. 내가 무슨 얘기를 해줬으면 하니?” “모르겠어요.” 아들과 아버지 사이의 대화는 짧게 이어졌고, 이튿날 새벽 아버지는 세상을 떠났다.
음성 혁명의 시대
아들의 이름은 이 책 ‘당신이 알고 싶은 음성인식 AI의 미래’를 쓴 제임스 블라호스다. 과학 분야 저널리스트인 그는 AI 스타트업인 ‘히어애프터'의 공동 설립자로 대드봇과 관련된 이야기가 한 잡지에 소개되면서 세계적인 주목을 받기 시작했다. 저자는 그동안 지구촌의 많은 이들로부터 연락을 받았는데, 예컨대 암 진단을 받은 한 남자는 생후 6개월 된 딸이 아버지를 기억할 수 있도록 자신의 음성과 기억이 담긴 봇을 만들어달라고 간청했다. 인도의 한 교사는 버스에 치여 비명에 세상을 뜬 아들의 복제 AI를 제작해달라고 했다. 기자들의 인터뷰 요청도 끊이지 않았는데, 자주 등장한 질문은 이런 거였다. “(대드봇과 같은 기술을 통한) 가상 불멸이 사업이 될 수도 있을까요.”
“말하는 컴퓨터”라고 할 수 있는 음성인식 AI는 이렇듯 인간의 죽음을 다른 차원에서 보게 만들 만큼 막강한 파워를 지니고 있다. ‘당신이 알고 싶은…’는 “인류 역사의 분수령”이라고 할 수 있는 말하는 컴퓨터의 등장을 입체적으로 살핀 저작이다. 대화형 AI는 그동안 할리우드 영화나 공상과학 소설에선 자주 사용된 소재이지만, 현실적인 관점에서 이 분야를 파고든 책은 거의 없었다. 저자는 책을 쓰기 위해 아마존 구글 같은 기업의 프로그래머들을 인터뷰했고, 개발 회의에도 직접 참여했다. 말하는 컴퓨터의 과거 현재 미래를 두루 살피기 위해서였다.
책에는 앞으로 인류가 대화형 AI를 통해 마주하게 될 미래가 얼마나 대단할지 가늠하게 만들어주는 이야기가 한가득 담겨 있다. 20세기 들어 컴퓨터는 눈부신 속도로 발전을 거듭했는데, 컴퓨터가 인간의 말을 듣고 이해하고 답하는 수준에 도달한 것은 비교적 최근의 일이다. 이유는 “대화야말로 AI의 가장 어려운 문제”였기 때문이다. 애플이 아이폰의 음성 인식 서비스 ‘시리’를 공개한 것이 2011년이고, 마이크로소프트가 음성 지원 비서인 ‘코타나’를 시장에 선보이고 아마존이 AI 스피커 ‘알렉사’를 출시한 게 2014년이었다. 이렇듯 음성인식 AI가 대중의 삶에 파고든 것은 2010년대가 시작되면서였는데 이 기술은 벌써부터 우리의 삶과 시장의 판도를 뒤흔들고 있다.
현재 음성인식 AI가 탑재된 기기는 스마트폰을 포함해 1000억개에 달할 것으로 추산된다. 머신러닝(machine learning·컴퓨터가 스스로 데이터를 분석해 문제해결 능력을 얻는 것) 기술은 하루가 다르게 발전하고 있다. “음성 컴퓨팅의 상황은 대중이 1993년 월드와이드웹이라는 이상한 신기술을 처음 들었을 때의 상황과 비슷하다. 또는 스티브 잡스가 아이폰을 처음 발표하기 전날인 2007년 1월 8일의 상황과도 닮았다. 음성 혁명이 시작되었다. 이것이 우리 삶의 방식을 바꿀 것이다.”
음성 혁명이 가져올 기회와 위기
책은 각각 ‘경쟁’ ‘혁신’ ‘혁명’이라는 제목을 내세운 3부로 구성돼 있다. 음성인식 AI 시장의 주도권을 쥐기 위해 펼쳐지는 기업들의 치열한 경쟁을 다루고, 기술적인 관점에서 말하는 컴퓨터를 만드는 게 왜 힘들었는지 살피고, 말미에는 음성 기술이 우리 삶을 어떻게 바꿔놓을지 들려준다.
에필로그의 제목을 그대로 빌리자면 음성인식 AI는 “최후의 컴퓨터”라고 명명할 수 있다. 이 기술은 자율과 타율, 사실과 허구, 삶과 죽음의 경계를 흐릿하게 만들어놓을 것이다. 특히 이 책에서 비중 있게 다뤄지는 내용은 산업계의 판도 변화다. 대중이 음성인식 AI에 친숙해지고, 그래서 온라인 검색이 주로 음성을 통해서만 이뤄진다고 상상해보자. 구글의 경우 매출의 상당 부분을 검색 광고에 의존해왔으니 엄청난 타격을 입을 것이다. 반면 아마존은 더 큰 힘을 지닐 가능성이 크다. 음성으로 쇼핑하는 사람은 아마존에서 일러주는 대로 쇼핑을 하게 될 것이기 때문이다(아마존은 100개 이상의 자사 브랜드를 갖고 있어 이런 제품을 음성 검색에서 처음 소개할 수도 있다). 방문자 수를 수익의 기반으로 삼는 언론사나 여타 콘텐츠 회사들도 커다란 변화에 직면할 게 불문가지다. 음성으로 정보를 검색하게 되면 정보가 담긴 웹사이트를 구태여 방문할 필요가 없어지기 때문이다. “효율성은 얻지만 그만큼 독립성을 잃는” 시대가 눈앞에 다가와 있는 셈이다.
한국어판의 감수는 국내 최초로 AI 스피커 ‘플루토’를 만든 장준혁 한양대 교수가 맡았다. 장 교수는 ‘생활의 중심에 침투하는 새로운 플랫폼’이라는 제목이 붙은 추천사에 이렇게 적었다. “음성인식 AI의 거의 모든 부분을 다루는 유일한 책이다. 나무보다는 숲을 본다는 마음으로, 저자의 놀라운 통찰력을 습득하는 독서가 되기를 바란다. 음성인식 AI로 서비스를 구상하는 사람, 그리고 인공지능이 바꿔놓을 세상의 모습을 이해하고 변화에 맞는 새로운 응용제품을 구상하는 사람이라면 이 책에서 큰 힌트를 얻을 것이다.”
박지훈 기자 lucidfall@kmib.co.kr