네이버는 자체 생성형 인공지능(AI) ‘하이퍼클로바X’를 텍스트뿐 아니라 이미지, 음성도 동시에 처리할 수 있는 멀티모달 AI로 고도화했다.
네이버는 지난 20일 하이퍼클로바X를 통한 이미지 인식 및 음성합성 기술을 공개했다. 하이퍼클로바X는 이미지 인식 능력을 기반으로 사진 속 현상을 묘사하거나 상황을 추론할 수 있다.
실제 한국 초·중·고등학교 검정고시 문항을 AI 모델에 이미지 형태로 입력하고 문제를 풀게 한 결과 하이퍼클로바X는 약 84%의 정답률을 보였다. 오픈AI GPT-4o의 78%보다 높은 수준이다.
네이버는 하이퍼클로바X의 이런 기능을 대화형 AI 에이전트 ‘클로바X’에 27일 탑재한다. 사용자는 클로바X 대화창에 업로드한 이미지에서 추출된 정보와 입력한 질의를 바탕으로 AI와 대화할 수 있다.