디지스트 개인정보 유출 없는 새 AI 연합학습법 개발

입력 2025-10-02 09:37
디지스트 캠퍼스 전경. 디지스트 제공

대구경북과학기술원(DGIST·디지스트)은 로봇및기계전자공학과 박상현 교수팀이 미국 스탠퍼드대학교 연구진과 공동으로 개인정보를 공유하지 않고도 대규모 모델을 효율적으로 학습할 수 있는 새로운 원샷 연합학습(Federated Learning) 인공지능 기법을 개발했다고 2일 밝혔다.

이번 연구 성과는 의료영상 분석 분야에서 개인정보 보호와 학습 효율성, 성능을 동시에 확보할 수 있음을 증명했다는 것에 의미가 있다.

의료영상 데이터는 환자의 민감한 개인정보를 포함하고 있어 병원 간 공유가 제한적이며 이로 인해 대규모 데이터를 활용한 인공지능 모델 개발에 어려움이 있었다. 이를 극복하기 위해 제안된 연합학습은 환자 데이터 대신 학습된 모델만을 공유해 공동 학습을 수행하지만 반복적인 전송으로 인해 시간과 비용 소모가 크다는 한계가 있었다. 이에 대한 대안으로 원샷 연합학습이 연구돼 왔으나 기존 방법은 여전히 높은 계산 비용과 오버피팅(Overfitting) 문제가 있었다.

박상현 교수 연구팀은 이러한 한계를 해결하기 위해 합성 이미지에 구조적 노이즈를 추가하고 믹스업(mixup) 기법을 활용해 가상의 중간 샘플을 생성하는 방식을 제안했다. 이를 통해 학습 데이터 다양성을 확보해 오버피팅을 줄이고 합성 이미지를 재활용함으로써 불필요한 연산을 줄여 계산 효율성을 크게 개선했다.

연구팀은 해당 기법을 방사선영상, 병리영상, 피부경영상, 안저영상 등 다양한 의료영상 데이터셋에 적용한 결과 기존 원샷 연합학습 방법보다 더 적은 계산으로 더 높은 정확도를 달성했다.

박상현 교수는 “개인정보 보호와 통신 제약이라는 현실적 조건 속에서도 의료영상 분야에서 범용적으로 활용 가능한 모델을 학습할 수 있다는 점에서 의미가 크다”며 “앞으로도 이 기법을 발전시켜 개인정보 보호를 보장하면서 다양한 환자군을 아우르는 인공지능 모델을 개발해 정확하고 신뢰성 높은 진단 보조 시스템 구축에 기여하겠다”고 말했다.

한편 이번 연구는 디지스트 일반사업, 한국연구재단 우수신진과제, 과학기술정보통신부 AI 스타펠로우십 지원사업의 일환으로 수행됐으며 연구 결과는 의료영상 분석 분야 최상위 국제 학술지(Medical Image Analysis) 10월호에 게재됐다.

대구=최일영 기자 mc102@kmib.co.kr