시사 > 전체기사

유튜브 감청 음모론 진짜일까?… 직접 실험해 봤습니다

국민일보 기자 2명 실험해보니…

하루 5분 특정 단어 주제로 대화
며칠 지나도 연관 추천 영상 없어
1주일 짧은 실험, 의혹 해소 역부족

게티이미지

“운전 연수를 받는 중이라고 지인과 통화했더니 유튜브 추천 영상에 ‘초보운전 팁’이 떴다.”

“아이가 영어 단어를 못 외워서 고민이라는 대화를 하자 유튜브에 ‘영단어 암기법’이 나왔다.”

구글이 실시간으로 사용자의 음성을 수집해 유튜브 동영상 추천에 사용한다는 ‘음모론’은 수년째 제기되고 있다. 최근에도 온라인 커뮤니티에는 유튜브가 일상 대화를 몰래 듣고 필요한 영상이나 광고를 띄우는 것 같다는 경험담이 자주 올라온다. 구글 측은 4일 이 같은 의혹에 대해 “흔한 오해지만 사실이 아니다”면서 “유튜브 알고리즘은 ‘800억개 시그널(신호)’를 기반으로 학습되고 있다”고 밝혔다.

유튜브가 전 국민을 감청하고 있다는 의혹은 사실 무근일까. 고도화된 유튜브 알고리즘이 마치 내 말을 엿듣는 것처럼 적시에 필요한 영상을 추천하는 걸까. 국민일보 2명의 기자는 지난 일주일간 구글이 실제로 음성을 수집해 유튜브 영상 추천에 활용하는지 확인하기 위한 실험을 했다.

우선 2명의 기자는 하루에 5분가량 특정 단어를 주제로 스마트폰 옆에서 대화를 해봤다. 변수를 최소화하기 위해 다른 애플리케이션이 하나도 깔려 있지 않은 스마트폰 공기계를 사용했다. 주제어는 각각 ‘팥빙수’ ‘바비인형’으로 일상에서 거의 말해본 적 없는 단어를 선택했다. 구글 계정은 새로 만들었고, 계정 생성을 위한 필수 약관에만 ‘동의’를 선택했다. 계정 설정은 초깃값에서 바꾸지 않았다. 스마트폰은 실험 외에 다른 용도로는 사용하지 않았다.

며칠이 지나도 유튜브에 팥빙수나 바비인형 관련 영상이나 광고는 추천되지 않았다. 스마트폰에 대화 녹음을 저장했을 때도, 관련 주제로 통화한 경우에도 단어와 연관된 추천 영상은 나오지 않았다. 대신 조회수가 높은 ‘먹방’과 스포츠, 뉴스 등 콘텐츠가 두 개의 스마트폰에 공통적으로 추천됐다. 데이터 및 개인정보 보호 관련 설정도 바꿔봤다. ‘음성 및 오디오 활동’을 서버에 보내는 것에도 동의해봤다. 그러나 결과는 마찬가지였다. 서버에 보내는 음성 및 오디오 활동 데이터는 음성인식 기술을 높이는 데만 사용된다는 게 구글의 설명이다.

구글코리아 측은 “구글이 휴대전화를 통해 이용자의 음성을 무단 수집해 저장하고 있다는 의혹은 사실이 아니다”고 밝혔다. 일각에선 구글이 인공지능(AI) 음성 비서 서비스 ‘구글 어시스턴트’를 통해 음성을 수집한다고 의심한다. 이에 대해 구글코리아는 “구글 어시스턴트의 경우 ‘오케이 구글’이라는 음성 신호가 감지될 때까지 대기 모드를 유지한다”며 “대기 모드에선 이용자가 말하는 내용이 전혀 전송되지 않는다”고 설명했다. 즉 ‘오케이 구글’이라는 음성 뒤에 나오는 사용자 요청을 서버에 전송해 요청에 따른 기능을 수행할 뿐이라는 얘기다.

그렇다면 사용자가 좋아할 만한 영상을 ‘귀신같이’ 추천하는 알고리즘의 실체는 무엇일까. 구글 측은 “추천 시스템은 계속 진화 중이다. 약 800억개의 다양한 신호를 통해 학습하고 있다”고 설명한다. 시청 및 검색 기록, 채널 구독 정보, ‘좋아요’ ‘싫어요’ ‘관심 없음’ ‘채널 추천 안함’ 등의 사용자 반응, 영상 만족도 설문조사 등이 기본적인 신호다. 시청을 중단한 시점은 어딘지, 유사한 그룹의 사용자들 시청 습관 비교 등 비교적 ‘디테일’한 신호도 있다. 구글은 “추천 시스템 원리는 단순한 공식의 나열이 아니다. 여러 시그널이 서로 영향을 미치기도 한다”고 덧붙였다. 다만 구글은 기본 신호 외에 800억개를 구성하는 다른 신호들의 정보에 대해선 구체적으로 밝히지 않고 있다. 유튜브의 추천 알고리즘이 아직 미지의 영역으로 남아 있는 이유다.

결국 유튜브 알고리즘은 사용자의 무수한 활동 데이터를 토대로 ‘무한 진화’한다고 볼 수 있다. 음성을 무단으로 수집하는 게 아니라고 해도 사용자의 선호와 필요에 따른 선택과 반응을 구글이 실시간으로 들여다본다는 의혹은 쉽게 버려지지 않는다. 사용자가 활동 데이터를 더 이상 수집 못 하도록 설정할 순 있다. 구글 계정 설정에서 데이터 및 개인정보 보호→기록 설정→유튜브 활동 제어 등의 메뉴를 거쳐 기록 저장 및 활용 기능을 비활성화시키면 된다. 활동 데이터 수집을 막으려면 이같이 복잡한 과정을 거쳐야 하는 것이다.


매일 진화하는 알고리즘은 한국인들의 유튜브 의존도를 높이고 있다. 앱 분석 서비스 업체 와이즈앱·리테일·굿즈의 국내 안드로이드 및 iOS 사용자 표본 조사에 따르면 지난 10월 기준 한국인의 월간 유튜브 사용시간은 1044억분에 달했다. 2018년 395억분에서 5년 새 2.6배로 늘어난 것이다. 카카오톡(319억분)보다 3배, 네이버(222억분) 대비 5배 길었다. SNS인 인스타그램(172억분), 틱톡(79억분)과도 큰 차이가 났다.

구글이 유튜브를 포함해 자사 서비스에서 광범위하게 데이터를 수집·활용하는 행태는 지속적으로 논란이 되고 있다. 지난 2020년 구글은 지도 앱을 통해 이용자 위치 정보를 무단으로 추적한 혐의로 미국 40개주로부터 소송을 당했다. ‘위치 히스토리’를 비활성화한 사용자의 위치 정보까지 수집했다는 혐의였다. 구글은 지난해 11월 3억9150만 달러(약 5200억원)를 주정부에 합의금으로 지급했다. 같은 해 미국 텍사스주는 구글이 이용자의 생체 데이터를 불법 수집하고 있다며 소송을 제기하기도 했다. 결론적으로 국민일보의 실험은 2명의 기자가 일주일이란 짧은 시간에 이뤄졌기에 유튜브의 국민 감청 의혹을 풀기에는 역부족이었다.

조민아 임송수 기자 minajo@kmib.co.kr



GoodNews paper ⓒ 국민일보(www.kmib.co.kr), 무단전재 및 수집, 재배포금지

국민일보 신문구독
트위터페이스북구글플러스