시사 > 전체기사

재료만 보고 요리 추천… 더 똑똑해진 GPT-4 나왔다

미 변호사 시험 치렀더니 상위 10%
“독창적 미래 가설 제시 못해” 한계

국민일보DB

생성형 인공지능(AI) 돌풍을 일으킨 챗GPT 개발사 오픈AI가 14일(현지시간) 최신 버전 ‘GPT-4’를 공개했다. 기존 챗GPT에 적용됐던 GPT-3.5의 상위 운영 체제다. 컴퓨터 프로그래밍부터 회계, 의학까지 다양한 분야에서 전문가 수준의 지식을 발휘할 정도로 업무 수행 능력과 정확도가 크게 개선됐다.

오픈AI는 이날 ‘인간 수준의 능력’을 갖춘 대규모 언어모델(LLM) GPT-4를 출시했다고 밝혔다. GPT-4는 오픈AI의 자체 실험 결과 모의 변호사시험에서 90번째, 미국 대학수학능력시험(SAT) 읽기, 수학시험에서 각각 93번째와 89번째의 백분위수를 기록했다. 상위 10% 안에 드는 성적이다. 이전 버전은 변호사시험에서 불합격했고 SAT에서도 그다지 높은 성적을 받지 못했다.

이전 모델과 달라진 특징은 이미지, 영상 독해 능력을 갖췄다는 것이다. 그렉 브록먼 오픈AI 사장 겸 공동설립자는 허블 우주망원경이 촬영한 영상을 GPT-4가 6개 문단으로 상세하게 설명하는 것을 시연했다. GPT-4는 식재료가 포함된 냉장고 내부 사진만으로 만들 수 있는 음식을 추천하기도 했다. 현상을 문장으로 서술해낸다는 점에서 높은 평가를 얻었다.

GPT-4의 진가는 의학 등 고도화된 지식이 요구되는 전문 분야에서 선명하게 나타난다. 뉴욕타임스(NYT)에 따르면 심장내과 전문의인 애닐 게히 미 노스캐롤라이나대 교수는 GPT-4가 적용된 챗GPT에 하루 전 진료한 환자의 병력과 합병증을 설명했다. 일반인이 알아듣기 어려운 의학 용어를 다수 사용했다. 그런데도 GPT-4는 게히 교수가 “완벽한 치료법”이라고 혀를 내두를 정도로 정확한 답변을 제공했다.

팝스타 마돈나를 포함해 참신한 유머를 들려 달라고 요청했을 때 GPT-3.5는 “마돈나가 은행에 간 이유는? 실제 돈을 빌리려고”라고 답하는 데 그쳤다. 하지만 GPT-4는 “마돈나가 기하학을 배우는 이유는? 다양한 각도로 포즈를 취하는 방법을 알고 싶어서”라고 답했다. ‘모델처럼 화려하게 포즈를 취하라’는 메시지를 담은 마돈나의 대표곡 ‘보그(Vogue)’를 연상케 했다.

하지만 NYT는 “아직 인간의 지능을 따라잡기는 미흡하다”고 총평했다. 이미 일어난 일에 대해서만 추론할 뿐 독창적인 미래 가설을 제시하지 못하는 것이 가장 큰 한계점으로 지목됐다. 예컨대 “향후 10년간 자연어 처리 연구에서 중요한 과제는 무엇이냐”고 물었을 때 GPT-4는 기존 데이터를 나열하는 데 그쳤다. 오렌 에치오니 엘렌 인공지능 연구소장은 “새로운 추측을 하는 게 아니라 다른 사람들의 분석을 종합하는 것 같다”고 지적했다. 중요한 의사결정과 최종 판단은 결국 인간 손에 달려 있다는 얘기다.

오픈AI는 “새로운 소프트웨어는 아직 완벽하지 않으며 많은 시나리오에서 인간보다 능력이 떨어진다”며 “여전히 ‘환상’을 갖고 답을 지어내며 틀렸을 때도 옳다고 주장하는 경향이 있다”고 했다.

송태화 기자 alvin@kmib.co.kr



GoodNews paper ⓒ 국민일보(www.kmib.co.kr), 무단전재, 수집, 재배포 및 AI학습 이용 금지

국민일보 신문구독
X 페이스북 카카오톡