시사 > 전체기사

美의사시험 패스한 AI 비결… 의학교과서 18종 ‘열공’

韓연구팀 개발 참여 sLLM, 미 의사시험 통과
오픈소스 sLLM로는 처음
“560억개 매개변수 AI 모델도 개발”


고려대 컴퓨터학과 강재우 교수 연구팀과 임페리얼 칼리지 런던 대학이 공동으로 개발한 인공지능(AI) 모델 ‘미어캣-7B(Meerkat-7B)’가 미국 의사면허시험(USMLE)을 통과하는 데 성공했다. 컴퓨터 1대로 돌릴 수 있는 공개형(오픈소스) 소형언어모델(sLLM)이 이 시험을 통과한 것은 처음이다.

Meerkat-7B는 평균 합격선 60점인 미국 의사면허시험에서 74점을 얻었다. 오픈AI의 GPT-4 등 최신 거대언어모델(LLM)은 이 시험을 통과하는 성능을 갖췄다. 하지만 기존 최고 sLLM으로 평가되는 ‘MediTron-7B’는 52점에 그쳐 시험을 통과하지 못했다.

강재우 고려대 컴퓨터학과 교수

높은 성적을 낸 데는 다수의 미국 의학 교과서를 체계적으로 학습시킨 효과가 컸다. 강 교수는 9일 국민일보와의 통화에서 “어떤 자료를 갖고 어떻게 효율적으로 학습을 잘 시키느냐에 따라 AI 모델의 성능이 좌우된다”며 “연구팀은 미국 의대생들이 공부하는 의학 교과서 18종을 모두 이 모델에 공부시켰다”고 말했다. 이어 “각 교과서의 문제를 어떻게 논리적으로 풀 수 있는지에 대한 예시를 만들어 공부시킨 게 효과적이었다”고 설명했다.

sLLM은 매개변수 수십억 또는 수백억개 수준이다. 매개변수 1000억개 이상의 LLM에 비해 훨씬 적은 컴퓨팅 자원으로 운용할 수 있다. 매개변수는 인간 뇌로 치면 신경세포 간 정보 전달을 하는 시냅스와 유사한 역할을 하는데 매개변수 수가 작을수록 컴퓨팅 자원을 덜 쓰게 된다.

오픈AI에서 만든 GPT-3.5의 매개변수는 1750억개인 반면 Meerkat-7B의 매개변수는 70억개에 불과하다. 강 교수는 “GPT 모델의 경우에는 (서버를 거치기 때문에) 민감한 개인 정보가 많은 병원에서 활용하기 어렵다”며 “병원 내부에 설치해서 쓸 수 있는 스마트한 소형 AI 모델에 대한 요구를 고려해 새로운 모델을 개발했다”고 말했다.

강 교수는 “GPT-4는 워낙 거대한 모델이어서 추론 능력도 뛰어나다”며 “하지만 어느 기관에서도 다 돌릴 수 있는 매개변수 70억개 이하의 오픈소스 모델로서 미국 의사면허시험을 통과한 건 이번이 처음”이라고 말했다.

이 모델은 투약 이력 등 환자 기록 관리를 포함해 병원 간호사들의 행정 업무뿐 아니라 치료 방법 등을 제시하는 용도로 활용될 것으로 예상된다. 또 질병의 원인을 연구한 논문을 분석하고 논문에서 제시된 가설을 구체화해 특정 단백질에 달라붙는 약물을 설계하는 등 신약 개발 용도로 쓰일 수 있다. 강 교수는 “이번 모델은 신약 개발 기술의 80% 수준에까지 와 있다고 볼 수 있다”고 말했다.

Meerkat-7B와 기존 오픈소스 언어모델과의 성능 비교

연구팀은 현재보다 8배 큰 560억개 매개변수의 AI 모델 개발도 진행 중이다. 강 교수는 “컴퓨터 1대에서 운용 가능한 모델이 필요한 기관뿐 아니라 이보다 큰 모델을 운용하고 싶은 기관들도 있을 것”이라며 “다양한 수요에 맞추기 위해 더 큰 모델에 대한 학습을 진행 중”이라고 말했다.

김경택 기자 ptyx@kmib.co.kr

GoodNews paper ⓒ 국민일보(www.kmib.co.kr), 무단전재, 수집, 재배포 및 AI학습 이용 금지

국민일보 신문구독
X 페이스북 카카오톡