LG 인공지능(AI)연구원이 세계 최고 권위의 AI학회인 ‘국제 컴퓨터 비전 및 패턴 인식 학술대회(CVPR) 2022’에서 초거대 AI ‘엑사원’의 기술력을 선보인다고 19일 밝혔다. LG AI연구원에서 개발한 엑사원은 세계 최초로 언어와 시각 정보 간 양방향 소통이 가능한 초거대 멀티모달 AI다. 엑사원에 사진을 보여주면 사진 속 모습을 문장으로 묘사하고, 문장을 보여주면 문장과 일치하는 이미지를 화면에 띄운다.
지난 2월 뉴욕 패션 위크에서는 엑사원을 활용해 만든 AI 아티스트 ‘틸다’가 박윤희 디자이너와 협업해 200개 넘는 의상들을 선보이기도 했다. 당시 박 디자이너는 “틸다에게 ‘금성에 핀 꽃을 그려줘’라고 했는데 너무나도 다양한 영감을 나한테 줬다”고 놀라워했다.
LG AI연구원은 학회에서 엑사원의 멀티모달 AI 핵심 기술과 관련한 단독 연구 논문 등 7편의 논문을 발표했다. 이 중 멀티모달 관련 논문 등 2편은 구두 발표 대상으로 선정됐다. 구두 발표 기회는 학회에 제출된 논문 중 4% 이내에 해당하는 최상위 평가를 받은 연구에만 부여된다. LG 측은 “학계 중심의 산학 협력 논문이 주류인 AI학회에서 개별 기업이 단독 연구 논문을 발표하는 건 그만큼 기술력을 입증했다는 의미”라고 설명했다.
황인호 기자 inhovator@kmib.co.kr