[시론] 딥시크 열풍과 안전한 AI

입력 2025-02-25 00:33

설 연휴 중국산 인공지능(AI) 딥시크 소식은 충격과 생각거리를 던져줬다. 특히 추론용 딥시크 R1은 최신 그래픽처리장치(GPU)를 사용하지 않고, 개발 비용은 기존의 10분의 1도 들지 않았는데 오픈AI의 o1에 버금가는 성능을 낸다는 점은 충격적이었다. 취임 직후 5000억 달러(약 750조원) 규모의 스타게이트 프로젝트를 발표하면서 AI 1위 국가로서 대세를 굳히려던 도널드 트럼프 미국 대통령도 당황하게 만든 뉴스였다.

모든 논란에도 불구하고 딥시크는 여러 가지 생각거리를 줬다. 특히 AI 세계 3위 국가를 목표로 전력 질주한 우리에게 여러 가능성과 동기를 부여했다. AI도 오픈소스를 적극 활용하는 것이 경쟁력이라는 점, GPU 같은 고비용 인프라 확보 못지않게 전문인력 확보와 그들의 창의력이 더 중요하다는 점, 데이터 증류나 전문가기반혼합(MoE) 같은 최신 알고리즘을 공격적으로 활용하는 것도 가성비 측면에서 유리하다는 점 등이다.

그런데 딥시크는 가성비 최고의 첨단 AI라는 타이틀 못지않게 과연 안전한지에 많은 의문이 남는다. AI안전연구소는 설 연휴도 반납하고 딥시크 오픈소스를 설치한 후 안전 검점을 시행했다. 그 결과 안전한 AI로 부르기에는 충분하지 못한 요소가 많이 발견됐다. 우선 딥시크는 중국 사회주의 체제에 유리한 방향으로 편향된 답변이 상당수 생성됐다. 글로벌 공정성에 부합하지 않으며 딥시크 오픈소스를 토대로 파생될 AI 제품과 서비스 역시 중국 중심의 차별과 편견에서 벗어날 수 없음을 의미한다. 여느 초거대 언어모델이 가지는 ‘탈옥 현상’ 역시 나타났다. 특히 보안기업 시스코(CISCO) 연구팀이 보유한 데이터셋을 기준으로 점검해 볼 때 유일하게 딥시크만이 100%라는 높은 탈옥 취약성을 보였다. 탈옥은 숨겨진 위험에 대한 일반인의 접근을 가능케 해 대량살상무기 제조, 사이버 공격 지원 등을 가능케 한다.

더 심각한 것은 이용자 개인정보 보호 침해 위험이다. 딥시크는 처음엔 이용자의 키보드 입력 패턴까지 가져가겠다고 약관에 공지했다가 비난에 직면하자 2주 만에 삭제했다. 2년 전 챗GPT가 공개됐을 때 이탈리아가 3주간 차단하면서 개인정보 보호 강화를 요구했던 항목 중 이용자의 대화 목록 삭제 기능(옵트 아웃) 제공이 있었다. 딥시크에도 이를 요구했으나 지금까지는 제공하지 않는다. 따라서 딥시크를 활용한 이용자의 모든 대화 내용은 나중에 학습 데이터로 사용될 수 있어 개인정보 유출 가능성이 크다.

특히 중국은 사회주의 국가로서 중국 국적 기업이 보유한 개인정보에 정부가 보안을 이유로 접근할 수 있다. 이 경우 딥시크 이용자의 개인정보는 중국 정부로 흘러들어가며, 다른 기업이 보유한 개인정보와 통합돼 이용자별 프로파일이 생성된다. 특정 이용자에 대한 다양한 성향 분석 및 인간관계 분석 등이 가능해지는 것이다. 상업적으로는 개인별 마케팅 전략 수립에 이용할 수 있고, 정치적으로는 사회주의 체제에 대한 충성 수준을 분류할 수 있다. 딥시크의 이용자 개인정보가 틱톡의 모기업 바이트댄스로 흘러들었다는 개인정보보호위원회의 발표는 이러한 심증을 굳혀준다.

딥시크는 물론 중국 국적 기업들이 제공하는 서비스와 제품을 이용할 경우 개인·사생활 정보가 약관 범위를 벗어나 이용될 가능성이 있다는 점을 고려할 필요가 있다. 그럼에도 남들보다 앞서 딥시크를 사용해 보고 싶다면 별도 이메일 계정을 만들어 기존 이메일 계정과 분리해 접근해야 한다. 정부기관 역시 새로운 글로벌 서비스가 발생할 때마다 국민 안전을 위해 적극적인 선제 대응에 나서야 한다. 중국 기업의 개인정보 유용 의심이 갈수록 깊어지는 현상은 우리나라에서만 일어나는 일이 아니다. 더 심화되지 않도록 중국 정부의 구체적인 대응과 객관적 조치가 필요하다.

김명주 인공지능안전연구소장