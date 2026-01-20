빅테크, 양질 AI 데이터 확보전



네이버, 블로그에 라운지까지 오픈

카카오, 채팅·그룹방 수다 활성화

저작권 걱정 없이 대화 데이터 확보

메타, 스레드 게시물 AI 학습 활용

게티이미지뱅크

유수의 정보기술(IT) 기업들이 ‘수다의 판’을 까는 데 몰두하고 있다. 인공지능(AI) 시대의 핵심 자원인 생생한 데이터를 저작권 침해 걱정 없이 마음껏 확보하기 위해서다. 아무리 성능이 좋은 AI라도 학습할 데이터가 없으면 ‘깡통’에 불과하다. 특히 사람과 사람 간의 대화는 문화와 경험, 맥락이 총체적으로 집합된 양질의 비정형 데이터가 된다. 에이전틱 AI 개발을 서두르는 기업들에도 ‘사람의 이야기’는 필수적이다. 비서 역할을 해야 하는 에이전틱 AI는 질문에 맞는 답을 내놓는 수준을 넘어 스스로 추론과 판단을 수행하는 것이 핵심이다. 실제 사람들이 어떤 주제에 어떻게 반응하는지를 끊임없이 탐구하고 체화하는 과정이 필요한 것이다.



네이버는 오는 28일 신규 오픈 커뮤니티 서비스 ‘라운지’를 정식으로 선보일 예정이다. 라운지는 별도 가입이나 승인 절차 없이 대화에 즉시 참여할 수 있는 개방성이 특징이다. 네이버의 강력한 무기인 ‘검색’과도 시너지 효과를 낸다. 포털에서 드라마 정보를 찾아보거나, 뉴스를 보다가 자연스럽게 관련 주제 대화방으로 유입되도록 동선을 짠 것이다. 이용자들은 엔터테인먼트와 스포츠, 유머, 일상 등 원하는 대화 주제를 골라 게시판에 직접 글을 올리거나, 댓글을 다는 방식으로 소통할 수 있다. 각 게시판은 네이버의 채팅 서비스인 ‘오픈톡’과도 자동으로 연계된다. 네이버는 라운지 출시를 앞두고 초기 분위기를 주도할 공식 서포터즈 ‘라운지 메이트’ 500명을 모집하고, 네이버페이 포인트를 지급하는 등 공을 들이고 있다.



네이버는 이미 블로그, 카페 등 강력한 커뮤니티 인프라를 보유 중이다. 그럼에도 새로운 도전에 나서는 배경에는 ‘실시간 데이터’를 확보하려는 의도가 담겼다는 분석이 나온다. 네이버는 올 상반기 서비스 전반의 데이터와 기술 인프라를 하나로 통합한 ‘에이전트N’ 공개를 앞두고 있다. 에이전트N의 목표는 ‘초개인화’ 시장의 선점이다. AI로 이용자의 의도를 읽고 행동을 예측해 ‘검색어 입력’에 드는 고민마저도 없애버리겠다는 전략이다. 이런 측면에서 라운지를 통해 생성되는 방대한 대화 데이터는 인간을 흉내내려는 에이전트N에게 꼭 맞는 기초 자료가 될 수 있다.



카카오가 개발한 AI 메이트 서비스 ‘카나나’ 역시 수다를 통해 성장한다. 개인 메이트인 ‘나나’와 그룹 메이트인 ‘카나’는 채팅방에서 오고 간 대화와 정보를 학습한다. 이를 통해 이용자들은 서비스를 사용할수록 ‘나를 더 잘 이해한다’는 느낌을 받게 된다. 수다의 활성화를 위해 색다른 서비스도 적극적으로 시도하고 있다. 카카오는 지난해 한국프로야구(KBO) 포스트시즌에 맞춰 ‘편파중계’ 응원방을 운영한 바 있다. 대화 맥락을 분석한 카나가 경기 중계와 구단별 응원, 득점 상황 요약, 역전 가능성 분석 등을 제공하는 형식이었다. 카카오는 향후 카나나에 주제별 메이트를 더 늘리고 그룹방도 꾸준히 활성화해 ‘커뮤니티 AI 서비스’를 완성하겠다는 구상이다.





대화의 장에서 데이터 수집에 성공한 사례로는 메타의 SNS인 ‘스레드’도 빼놓을 수 없다. 스레드는 엑스(X·옛 트위터)를 베끼는 카피캣 전략에서 출발했다. 한 게시물 당 최대 500자의 글만 쓸 수 있고, 피드 화면 구성도 엑스와 유사한 점이 많았다. 하지만 인스타그램 연동을 통해 초기 사용자 모집에 성공했고, 이후 격식 없는 분위기와 활발한 정보 공유 문화를 장려하는 등 서비스 영역을 키우기 위해 부심했다. 그 결과 출시 약 2년 만에 글로벌 월간활성이용자수(MAU)가 4억명을 돌파했다. 시장조사업체 시밀러웹에 따르면 지난 7일 하루 동안에는 1억4150만명의 활성 이용자를 기록하며 처음으로 엑스를 앞서는 쾌거를 이루기도 했다. 한국의 경우 도입 초반 부진을 겪었지만, 스레드만의 ‘반말 소통’ 문화가 차츰 인기를 얻으며 지난해 12월 기준으로 MAU 692만명을 기록했다.





메타는 스레드에 게시된 공개 게시물과 댓글, 오디오 등을 자사 AI ‘라마’의 학습에 전면적으로 활용하고 있다. 스레드 이용자들은 가입 시 기본적으로 데이터를 AI 학습에 활용하는 것에 동의하게 된다. 메타는 데이터 학습을 거부하는 사용자 경우 이의제기 신청을 받는 ‘옵트 아웃’ 방식을 택하고 있다.



박선영 기자 pomme@kmib.co.kr



