국가대표 인공지능(AI) 모델 구축 프로젝트가 시작됐다. 네이버클라우드, 업스테이지, LG AI연구원, NC AI, SK텔레콤 등 5곳이 개발 정예팀으로 선정됐다. 이들이 만든 AI 모델은 한국형 공통 AI로, 전 국민이 쉽게 사용할 수 있고 좀 더 전문적인 AI를 만드는 데 활용된다.
5개 팀 모두 멀티모달(Multi Modal) AI를 만들겠다고 한다. 모달은 모달리티(Modality·형태)의 줄임말이다. 시각 청각 촉각 등을 활용해 사물을 받아들이고 이해하는 인간과 같은 방식으로 학습하는 AI다.
네이버클라우드는 네이버, 트웰브랩스, 서울대, KAIST, 포항공대, 고려대, 한양대와 컨소시엄을 구성하고 있다. 초거대 언어모델 하이퍼클로바X를 바탕으로 트웰브랩스의 영상AI 기술을 결합해 텍스트 이미지 오디오 비디오 등 다른 데이터를 통합 이해·생성하는 ‘옴니(Omni) 파운데이션 모델’을 개발한다. 업스테이지는 래블업(GPU 가상화 기술), 노타AI(경량화 최적화), 플리토(데이터 전처리 및 품질평가), KAIST, 서강대와 컨소시엄을 구성했다. 이들은 신규 독자 모델을 개발한다. 다국어 처리, 멀티모달 대응, 산업특화형 모델 개발 등으로 확장해 나간다는 계획이다.
LG AI연구원 컨소시엄에는 LG유플러스, LG CNS, 슈퍼브AI, 퓨리오사AI, 프렌들리AI, 이스트소프트, 이스트에이드, 한글과컴퓨터, 뤼튼테크놀로지스 등 10개 회사가 참여하고 있다. 엑사원을 바탕으로 프런티어 AI를 개발하겠다고 한다. 프런티어 AI는 스스로 발전하고 학습하는 AI다.
NC AI는 54개 기관과 컨소시엄을 구성했다. ETRI(한국전자통신연구원), 에이아이웍스, 포스코DX, 롯데이노베이트, HL로보틱스, 인터엑스, 미디어젠, 문화방송, NHN 등과 롯데·포스코의 40개 수요기업 등이다. 목표는 ‘산업 AI 전환을 위한 확장 가능한 멀티모달 생성용 파운데이션 모델’ 개발이다. 서비스, 제조·유통·로봇·콘텐츠·공공 산업을 위한 산업 특화모델이다.
SK텔레콤은 독자 기술 기반의 풀스택 AI를 구현하는 게 목표다. 풀스택 AI는 데이터 수집부터 모델 개발, 배포 및 서비스 제공까지 전 과정을 AI로 진행하는 모델이다. 게임회사 크래프톤, 차량 AI기업 포티투닷(42dot), 추론형 AI 반도체(신경망처리장치/NPU) 제작사 리벨리온, 전문 지식·정보 검색 AI 에이전트인 라이너, 데이터 안정성 확보 기술을 갖춘 셀렉트스타 등이 컨소시엄에 참여했다.
각 팀이 만들려는 AI 모델을 유추할 수 있기에 컨소시엄 구성회사를 일부러 열거했다. 각 분야 최고 수준 회사들이 만드는 AI가 벌써 기대된다. 단계별 평가에 국민 사용 평가도 포함된다니 사용할 기회를 얻었으면 하는 바람도 생겼다. 세계 수준의 AI 모델을 만들려면 기술력은 중요하다. 그러나 AI 모델의 정확도, 신뢰도, 활용 가능성을 좌우하는 가장 핵심적인 요소는 양질의 데이터다. AI에게 유의미한 학습효과를 주는 고급 데이터일수록 누군가의 고민을 거쳐 창조된 ‘저작물’이다. 뉴스 기사, 도서와 논문, 이미지, 영상, 음악 등은 대부분 창작자와 언론, 기업의 지식재산이다.
정부에서 지원하는 5개 팀의 데이터 구매비용은 총 628억원이다. 공동구매에 100억원, 팀별로 28억원을 추가 지원한다. 200억원 규모의 고품질 방송영상 학습용 데이터도 지원한다. 그래픽처리장치(GPU) 지원예산 4500억원에 비하면 아쉬운 수준이다. 정당하고 적정한 보상은 창작의 선순환 구조를 만들고, AI 기술의 지속 가능성을 담보한다. ‘AI 강국’을 외치려면 AI에게 학습시킬 양질의 콘텐츠부터 지켜야 한다.
전재우 사회2부 선임기자 jwjeon@kmib.co.kr