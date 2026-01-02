업스테이지 ‘중국 AI 모델 복사’ 주장에 “검증하겠다”
정부의 ‘독자 인공지능(AI) 파운데이션 모델’ 프로젝트 정예팀 중 하나로 선발된 업스테이지가 중국 인공지능(AI) 모델을 복사한 AI 모델을 발표했다는 주장이 제기됐다. 업스테이지는 AI 모델의 학습 과정을 공개 검증하겠다며 의혹을 부인했다.
지난 1일 AI 스타트업 사이오닉AI의 고석현 최고경영자(CEO)는 링크드인에 “국민의 세금이 투입된 프로젝트에서 중국 모델을 복사하여 미세 조정한 결과물로 추정되는 모델이 제출된 것은 상당히 큰 유감”이라는 글을 올렸다.
그는 업스테이지의 AI ‘솔라-오픈-100B’가 중국 지푸(Zhipu) AI의 ‘GLM-4.5-에어’에서 파생됐을 가능성을 제기했다. 그가 근거로 제시한 리포트에 따르면 업스테이지의 ‘솔라 오픈 100B’ 모델의 AI 모델 신경망 중 일부분이 중국 모델과 96.8% 동일하다고 나와 있다.
이에 김성훈 업스테이지 대표는 즉각 반박했다. 그는 페이스북을 통해 “솔라-100B가 중국 모델을 복사해 미세조정을 한 것으로 추정된다는 글에 대해 사실과 다름을 알린다”며 “명확한 검증 절차를 공개해 사실관계를 바로잡도록 하겠다”고 밝혔다. 이어 “업스테이지는 명백히 ‘프롬 스크래치’로 학습을 했고, 학습에 사용한 체크포인트들과 WandB(실험 로그)를 모두 공개할 예정”이라고 덧붙였다.
임성빈 고려대 통계학과 교수는 “두 LLM의 특정 부분(LayerNorm) 파라미터의 코사인 유사도(cosine similarity)가 유사하다고 해서 ‘프롬 스크래치 학습이 아니다’고 주장하는 것은 통계적으로 다소 무리가 있다”며 “좀 더 신뢰성 있는 검증을 하려면 두 모델 레이어 간 코사인 유사도보다 파라미터의 분산과 절대적인 수치 차이를 봐야 한다”고 말했다.
임 교수는 “모델이 학습하는 과정에서 데이터의 특성에 맞춰 파라미터 변주가 큼에도 두 모델의 코사인 유사도가 높다면 미세조정 가능성이 높아진다”며 “특히 파라미터 분포를 그려봤을 때 이상치 위치가 일치한다면 의심해볼 여지가 있다”고 덧붙였다.
업스테이지는 독자 AI 파운데이션 모델 프로젝트의 정예팀으로 선정돼 지난달 30일 1차 발표회를 통해 AI 모델을 공개했다. 독자 AI 파운데이션 모델 프로젝트는 글로벌 AI 모델의 95% 이상의 성능을 가진 독자 AI 모델 개발을 목표로 추진하는 정부 사업이다.
심희정 기자 simcity@kmib.co.kr
