국내 정보기술(IT) 기업들이 잇따라 거대언어모델(LLM) 기반의 자체 인공지능(AI) 모델을 선보이며 ‘소버린 AI’ 흐름에 동참하고 있다. 독자적으로 AI 기술을 확보하는 소버린 AI 구축에 여러 기업들의 역량이 집중되면서 국가 AI 경쟁력 강화에도 탄력이 붙을 거란 기대가 나온다.
SK텔레콤은 오픈소스 커뮤니티 허깅페이스에 독자 구축 LLM인 ‘에이닷엑스 3.1’을 공개했다고 24일 밝혔다. 340억개의 매개변수를 기반으로 만들어진 이 모델은 SK텔레콤이 구조 설계부터 데이터 학습까지 전 과정을 직접 수행한 ‘프롬 스크래치’ 방식으로 개발됐다. 전작인 ‘에이닷엑스 3.0’이 한국어 대화 성능 중심이었다면 이번 버전은 코드와 수학 성능을 대폭 향상해 추론 모델로서의 확장성을 키웠다.
SK텔레콤은 이번 공개 이후 에이닷엑스 3.1 표준형과 경량형 모델 2종, 대규모 학습 기반의 ‘에이닷엑스 4.0’ 표준형과 경량형 2종 등 총 4개 모델을 오픈소스로 제공할 예정이다. 학술 연구와 상업적 활용 모두 가능하다.
에이닷엑스 3.1은 에이닷엑스 4.0 대비 절반 수준의 매개변수를 사용하지만 한국어 서비스를 적용하면 비슷한 수준의 성능을 발휘한다. 한국어 능력 평가 벤치마크 ‘케이엠엠엘유(KMMLU)’에서는 69.20점을, 한국어·문화 이해 평가 ‘클릭(CLIcK)’에서는 77.1점을 기록했다. 에이닷엑스 4.0 성능의 약 90%에 달하는 수준이다.
카카오도 경량 멀티모달 언어모델과 MoE(Misture of Expert) 구조 언어모델을 역시 허깅페이스를 통해 오픈소스로 공개했다. 이번에 새로 공개한 언어모델 ‘카나나 1.5-v-3b’는 텍스트뿐 아니라 이미지 정보도 처리할 수 있다. 이용자의 질문 의도를 정확히 이해한 뒤 지시를 수행하는 능력과 한국어·영어 이미지 이해 능력을 보유했다. 이미지 검색, 콘텐츠 분류 등 실시간성과 효율성이 요구되는 분야에서 효과적 사용이 가능하다. 카카오는 하반기 중 에이전트형 AI 구현에 필수적인 추론 모델 분야 성과도 공개할 예정이다.
나경연 기자 contest@kmib.co.kr