글로벌 인공지능(AI) 수준의 ‘국가대표 AI’를 개발할 정예팀으로 선발된 5곳은 모두 멀티모달 AI 개발을 최우선 목표로 내세웠다는 공통점이 있다. 이들이 집중하고 있는 멀티모달 AI는 여러 가지 형태의 데이터를 동시에 이해하고 처리하는 모델로, 미래 산업의 패러다임을 주도할 차세대 핵심 기술이란 점에서 높은 평가를 받았다.
정예팀 5곳 중 네이버클라우드와 LG AI연구원, 업스테이지 3곳은 업계에서 일찌감치 ‘3강’으로 꼽혔다. 과학기술정보통신부는 네이버클라우드가 텍스트·이미지·오디오·비디오 등 다중 데이터를 통합적으로 이해하고 생성하는 ‘옴니 파운데이션 모델’을 개발할 계획이라고 밝혔다. 네이버클라우드는 이 옴니 모델을 기반으로 전 국민이 쉽게 경험할 수 있는 AI 서비스를 제공할 방침이다.
LG AI 연구원은 자사 AI 모델 ‘엑사원 4.0’의 기술력을 기반으로 시각·자연어·행동 데이터를 통합하는 멀티모달 파운데이션 모델을 개발한다. 멀티모달 AI는 글로벌 최고 수준의 프런티어 AI를 목표로 하는 ‘K-엑사원’ 구현의 기반이 될 전망이다.
업스테이지는 광학문자판독(OCR) 기술과 대규모언어모델(LLM)을 결합한 멀티모달 기술력에서 높은 평가를 받았다. 최근 공개한 AI 모델 ‘솔라 프로2’는 글로벌 AI 분석 기관 아티피셜애널리시스의 지능 지표에서 국내 모델 중 유일하게 10대 개발사 중 하나로 이름을 올렸다. 업스테이지는 멀티모달을 기반으로 한 자체 학습 알고리즘을 새롭게 설계할 계획이다.
SK텔레콤도 이번 프로젝트에 적용하게 될 옴니 모델의 기술력을 인정 받았다. SK텔레콤은 대규모 멀티모달 한국어 데이터셋을 학습한 시각언어모델 ‘A.X 4.0 VL Light’를 오픈소스로 공개하며 AI 개발 생태계와 지속적으로 교류하고 있다.
NC AI는 엔씨소프트의 AI 연구 조직이 분사하면서 설립된 팀이다. NC AI의 생성형 AI ‘바르코’는 게임 캐릭터의 대사를 자동으로 생성하고 영상의 문맥을 읽는 게임 특화 멀티모달 모델이다. NC AI는 바르코 시리즈를 고도화하고 멀티모달 인지 생성 기술을 개발할 방침이다.
나경연 기자 contest@kmib.co.kr