대화로 감정까지 나누는 AI… 오픈AI, ‘GPT-4o’ 공개

사람처럼 보고 듣고 말하고
영화 속 AI 현실로 다가와
“환각 현상 등 부작용 우려”

입력 : 2024-05-15 00:11/수정 : 2024-05-15 00:11
게티이미지뱅크

오픈AI 엔지니어가 “잠을 잘 이루지 못하는 친구를 위해 이야기를 들려 달라”고 스마트폰에 말하자 동화책 읽는 듯 감정을 실은 목소리가 흘러나왔다. 누군가와 통화하는 장면이 연출됐지만, 목소리의 주인공은 바로 오픈AI의 최신 인공지능(AI) 모델이었다. 스마트폰 카메라에 ‘I♡ChatGPT’라고 쓴 종이를 비추자 AI는 “스윗하다”면서 한껏 기뻐하는 목소리로 반응했다.

오픈AI는 13일(현지시간) 이처럼 사람과 자연스럽게 대화할 수 있을 정도로 업그레이드된 AI 모델 ‘GPT-4o’(GPT-포오)를 공개했다. 이 모델에는 인간과의 의사소통을 모두 지원한다는 의미로 GPT-4o라는 이름을 붙였다. ‘o’는 모든 것이라는 라틴어 옴니(omni)를 뜻한다. 텍스트와 이미지를 이해하고 생성하는 것을 뛰어넘어 감정까지 표현하며 사람과 음성 대화를 할 수 있는 수준의 AI 모델이라는 점을 강조한 것이다.

미라 무라티 최고기술책임자(CTO)는 시연을 통해 실시간으로 대화하면서 질의응답까지 가능한 AI 모델이라고 설명했다. 예를 들어 종이에 적힌 수학 문제를 보여주고 “답을 말하지 말고 문제를 풀 수 있도록 해 달라”고 하면 GPT-4o는 이용자와 대화를 이어가며 정답을 끌어낸다. 지시어 몇 개를 주면 즉석에서 무반주로 노래를 하는가 하면, 카메라로 보는 세상의 풍경을 실시간으로 묘사할 수도 있다. 샘 올트먼 오픈AI 최고경영자(CEO)는 “인간 수준의 반응 시간과 표현력에 도달하는 것은 큰 변화”라고 말했다.

GPT-4o는 높은 수준의 추론을 매우 빠른 속도로 하기 때문에 이런 기능이 가능하다. GPT-4o의 응답 시간은 최소 232밀리초, 평균 320밀리초다. 1밀리초는 1000분의 1초다. 인간이 서로 대화하는 시간과 비슷한 수준이다. 이전 모델인 GPT-3.5와 GPT-4의 응답 속도는 각각 평균 2.8초, 5.4초였다.

이번 모델 공개로 글로벌 빅테크 간 AI 개발 경쟁은 더 치열해질 전망이다. 구글은 14일 ‘연례 개발자 회의’를 열고 AI 비서 서비스를 공개할 예정이다. 정보기술(IT) 업계에선 사람과 닮은 AI 개발을 경계해야 한다는 목소리도 나온다. 김명주 서울여대 정보보호학부 교수는 “사람처럼 너무 자연스러우면 자칫 이용자들이 대화 상대가 AI라는 사실을 잊을 수 있다”며 “AI가 사실과 다른 답을 하는 등 환각 현상을 포함한 AI 한계는 여전하기 때문에 오용으로 인한 부작용이 발생할 수 있다”고 말했다.

전성필 기자 feel@kmib.co.kr

GoodNews paper ⓒ 국민일보(www.kmib.co.kr), 무단전재, 수집, 재배포 및 AI학습 이용 금지

국민일보 신문구독
X 페이스북 카카오톡