세계 AI시장 판 흔든 ‘가성비 딥시크’ 맹점은 있다

입력 2025-02-03 02:31
로이터연합뉴스

중국 스타트업 딥시크가 불러온 파장이 거센 와중에 이들이 개발한 인공지능(AI) 모델의 맹점이 드러나고 있다. 딥시크가 ‘가성비’ AI를 구현했다는 점에는 이견이 없지만 불투명한 개발·훈련 비용과 편향성을 띤 언어모델, 정보 유출 우려에 대한 비판이 제기된다. 일부 국가는 딥시크 서비스 사용 제재에 나섰다.

2일 업계에 따르면 딥시크가 지난달 20일 공개한 AI 추론 모델 ‘딥시크-R1’에 들어간 총비용은 알려진 것보다 높을 것이라는 주장이 일고 있다. 딥시크는 R1에 쓰인 개발·훈련 비용을 공개하지 않았다. 대신 지난해 12월 전 버전 ‘딥시크-V3’ 공개 당시에는 사전 훈련, 문맥 확장, 사후 학습에 총 557만6000달러(약 80억원)가 들었다고 밝혔다. 딥시크는 관련 보고서에서 “선행 연구와 데이터, 알고리즘 등에 들어간 비용을 제외한 ‘공식 훈련(official training)’ 비용만 포함된 것”이라는 설명을 덧붙였다. V3의 총개발비는 다를 수 있다는 뜻이다.

김명주 서울여대 정보보호학과 교수(AI안전연구소장)는 “R1은 최소 2개 이상의 V3를 기반으로 강화학습시킨 모델”이라며 “훈련비를 산출하려면 기존 V3 계산량에 R1을 한 달 이상 강화학습하면서 들어간 계산량을 합해야 한다”고 말했다. 강화학습이란 AI에 보상을 주는 방법으로 행동을 학습시키는 기술로 막대한 컴퓨팅 파워가 필요하다.

R1 학습 시 어떤 반도체 칩을 사용했는지도 변수다. 딥시크는 V3에 엔비디아의 중국 수출용 H800을 사용했다고 밝혔지만 R1에는 이보다 높은 사양의 칩이 포함됐을 것이라는 관측도 나온다. 미국 반도체 연구업체 세미애널리시스는 딥시크가 R1 개발에 투입한 하드웨어 비용이 총 5억 달러(약 7300억원)를 웃돌 것이라고 주장했다.


딥시크 챗봇이 천안문 사태 질문에 회피하는 등 편향성 문제도 불거졌다. 이 때문에 딥시크가 R1을 오픈소스에 공개했어도 다른 나라 기업들이 중국에 편향된 언어모델을 기반으로 AI 서비스를 개발하는 건 리스크가 있다는 지적이 나온다. 김 교수는 “중국 AI는 공개 전 당성(黨性) 검사를 거치기 때문에 편향된 답이 나올 수밖에 없다”고 했다.

이런 논란에 미국과 일본, 대만은 정보 유출 우려로 공공부문에서 딥시크 사용 제한에 나섰다. 이탈리아는 자국에서 딥시크 애플리케이션 접속을 차단했고, 영국과 독일은 AI 모델에 대해 조사 중이다. 이에 샤오양화 푸단대 교수는 “중국의 기술 발전이 시장에서 성공해 미국을 위협하면 미국은 이 상황을 정치화하려 한다”고 관영 글로벌타임스에 말했다.

딥시크가 데이터 처리 원칙을 명확히 밝히지 않는 이상 정보 유출 우려는 지속될 전망이다. 장동인 카이스트(KAIST) AI대학원 책임교수는 “딥시크의 소형 언어모델은 기기 안에서 돌릴 수 있지만 대형 모델은 중국 서버를 거쳐야 하기 때문에 정보 유출 우려가 있다”고 말했다. 최경진 가천대 법학과 교수(한국인공지능법학회장)는 “딥시크에 입력되는 프롬프트(명령어)를 중국 정부가 볼 수 있는지 등 데이터 흐름을 점검해야 한다”며 “개인정보뿐 아니라 외교안보 문제도 고려해 입체적으로 대응해야 한다”고 말했다.

조민아 윤준식 기자 minajo@kmib.co.kr