기존의 기술·저비용 조합 전략 취해
챗GPT 등 생성형 AI 성능 능가 평가
불법 학습·IP 도난 의혹 제기 있지만
규칙 바꾸면 기회 열리는 것 보여줘
챗GPT 등 생성형 AI 성능 능가 평가
불법 학습·IP 도난 의혹 제기 있지만
규칙 바꾸면 기회 열리는 것 보여줘
“훌륭한 예술가는 모방하고, 위대한 예술가는 훔쳐온다”는 말은 파블로 피카소가 즐겨 사용했고, 이후 스티브 잡스가 인용하면서 더욱 유명해졌다. 창조는 하늘에서 떨어지지 않는다. 기존의 아이디어나 개념을 새로운 방식으로 조합하고 재구성하면서 나타나곤 한다. 사실 창조는 99% 기존 아이디어의 조합이며, 오직 1%의 차별적 아이디어에 의해 나타난다. 아이폰을 만든 애플이나 넷플릭스는 새로운 기술을 창조한 것이 아니다. 애플은 기존에 있던 기술인 터치스크린, 인터넷 브라우징, 앱 스토어 개념 등을 혁신적으로 조합한 결과였고, 넷플릭스는 이미 존재하는 스트리밍과 구독 모델을 조합하면서 사용자 친화적인 서비스로 통합한 것이 바로 1%의 창조였다.
최근 중국의 딥시크(DeepSeek)가 인공지능(AI) 경쟁에 뛰어들며 세상에 충격을 주고 있다. 챗GPT 등 기존 생성형 AI의 성능을 능가했다는 평가를 받으며, 미국 증시에도 큰 영향을 미쳤다. 딥시크의 전략을 분석하며 다시 한번 ‘게임의 규칙’을 생각해본다.
딥시크에 활용된 기술은 무엇인가?
딥시크가 충격을 준 이유는 천문학적인 비용이 소요되던 기존의 생성형 AI와 비교할 때 오픈소스 방식을 통해 접근성을 개선하고, 저비용으로 성능을 향상시키는 등 규모의 법칙을 깼기 때문이다. 딥시크의 핵심 기술 정책을 요약하면 다음과 같다.
첫째, 기존 생성형 AI와 달리 딥시크는 방대한 데이터에서 핵심 성분만 걸러내는 ‘증류(distillation)’ 기법을 적용해 좋은 성능을 구현할 수 있도록 했다. 이는 교사의 관점(Teacher model)에서 복잡한 내용을 전달하는 게 아니라 학생의 관점(Student model)에서 적은 자원, 작은 모델로 해결할 수 있도록 모델 압축과 효율성을 향상한 것이다.
둘째, 딥시크는 뉴런 전체를 동시에 활성화하는 방식 대신 필요한 부분만 활성화하는 ‘전문가 혼합 모델(Mixture of Experts)’ 기법을 사용했다. 예를 들어 언어 영역, 시각 영역, 코딩할 때는 코드 영역을 선택적으로 활성화해 불필요한 연산을 줄이고 처리 속도를 높일 수 있었다. 이는 사실상 인간 두뇌의 원리에 더 가까운 접근 방식이라고 할 수 있다.
셋째, 복잡한 문제를 한 번에 해결하는 대신 과정을 단계별로 차근차근 설명하며 최종 답변에 도달하는 ‘생각의 사슬(Chain of Thought)’을 사용했다. 마치 수학 문제를 풀 때 중간 계산 과정을 글, 그림, 도식 등으로 정리하면서 답을 찾는 방식이다.
넷째, 제반 기술 정책을 개별적으로 학습하는 대신 유사한 상대들을 그룹화해 강화학습을 적용하고 최적화하는 ‘그룹 상대 정책 최적화(Grouped Opponent Policy Optimization)’를 채택했다.
딥시크 AI: 모방인가, 창조인가?
딥시크는 AI 알고리즘에서 파인튜닝 대신 강화학습으로 스스로 길을 찾게 하는 지식추론 모델, 전문가 혼합, 지식 증류, 그룹 상대 정책 최적화 등을 사용했는데, 이는 딥시크의 원천 기술이 아니라 제프리 힌튼, 구글 리서치 등에 의해 모두 연구된 것이다. 그런 이유 때문인지 딥시크는 아키텍처, 알고리즘, 또는 데이터 선행 연구 및 실험과 관련된 비용을 제외했다고 하는데, 이를 두고 일각에서는 딥시크의 개발 비용 산출의 진실성에 대해 의문을 제기하기도 한다.
하드웨어에 있어서 엔비디아의 A100/H100 GPU를 활용해 모델을 훈련한 오픈AI처럼 딥시크도 엔비디아의 H100 칩을 사용했으며, 추론 단계에서는 화웨이의 Ascend 910C 칩을 활용했다고 발표했다. 이러한 조합을 통해 더 적은 비용으로 강력한 AI를 구축할 수 있었고, 높은 성능과 에너지 효율성을 달성했다고 주장한다.
하지만 일부에서는 딥시크가 기술 모방을 넘어 불법 학습 또는 지적재산(IP) 도난이 발생했을 가능성을 제기하고 있다. 도널드 트럼프 미국 대통령의 AI·가상자산 차르인 데이비드 삭스는 증류 기술을 구현하는 과정에서 부모의 데이터로부터 기술을 빨아들이는 자식과 같은 방식으로 딥시크가 오픈AI를 모방했다는 ‘증거’가 있다고 주장했다(파이낸셜타임스 2025년 1월 29일). 마이크로소프트 역시 딥시크의 불법 모방 가능성을 의심하며, 딥시크가 오픈AI의 애플리케이션 프로그래밍 인터페이스(API)에서 데이터를 부적절하게 수집했다고 주장했다. 사용자만 접근할 수 있는 오픈AI API를 활용해 대량의 데이터가 유출된 정황을 포착했다고 한다(스탠퍼드 사이버시큐리티 센터 2025년 2월 5일).
AI 개발 전략과 게임의 법칙
딥시크는 후발 주자로서 신기술 개발보다는 기존 기술을 저비용으로 조합하는 전략이어서 유의미한 시사점을 주며 게임의 규칙을 다시금 생각하게 한다.
첫째, 게임의 규칙 변경. 수요자 및 산업의 관점에서 설명 가능성과 적응성에 중점을 둔 모듈형 AI 솔루션을 추구하며 게임으로 규칙을 달리하는 전략을 사용하고 있다. 둘째, 비즈니스 관점의 게임. 이는 경쟁업체 대비 상당한 비용 절감효과를 제공하며, 기존에 막대한 투자가 필수였던 AI 개발에서 비교적 저비용으로 최첨단 AI 모델 개발에 도전할 수 있는 가능성을 높여준다. 결과적으로 AI 연구자와 스타트업의 진입 장벽을 낮추는 긍정적 영향으로 이어진다. 셋째, 인문학적 본질 파악. 아무리 AI시대가 고도화돼도 기술에 사람을 맞추는 방식이 아니라 인문학적·인지적 관점에서 사람을 위해 AI 모델을 최적화하는 발상은 언제나 중요하다. 성공적인 AI 전략 수립을 위해서 필요하다.
이처럼 게임의 전략을 바꾸면 AI 패권과 빅테크의 틈새에서도 도전할 기회가 열릴 것이다. 이를 위해 매월 해커톤을 개최해 혁신적 과제를 제시하고, 기존 게임 규칙을 뒤집는 창의적인 AI 전략을 수립하는 노력 속에서 새로운 게임의 법칙에 한 걸음 더 가까워질 수 있지 않을까.
여현덕 KAIST-NYU 석좌교수