생성형 인공지능(AI) 학습에 쓰이는 데이터의 출처를 공개해야 한다는 의견을 언론계가 국회와 정부에 전달했다. 언론단체들은 해외에서는 이미 생성형 AI의 신뢰도를 높이고 저작권자의 권리를 지키기 위해 이같은 조치가 시행되고 있다면서 이같이 주장했다.
한국신문협회와 한국신문방송편집인협회, 한국기자협회, 한국온라인신문협회, 한국인터넷신문협회 등 언론 5개 단체는 16일 이같은 내용의 의견서를 국회 과학기술정보방송통신위원회와 법제사법위원회, 문화체육관광부 등에 제출했다. 국회에서는 ‘AI발전과 신뢰 기반 조성 등에 관한 기본법안’이 논의중이다.
언론단체는 현재 논의 중인 법안이 AI사업자에게 투명성과 안전성 등을 확보하라고 규정한 것은 바람직하나 구체적인 조치가 필요하다면서 “AI 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관하고 공개하도록 하는 규정이 빠져있다”고 지적했다. 특히 “학습데이터 공개를 의무화하지 않는 것은 생성형 AI 사업자의 데이터 무단 이용을 허용해 저작권자의 권리를 심각하게 침해하게 된다”고 우려했다.
언론단체는 학습 자료가 공개되지 않으면 “저작권자는 자신의 저작물이 어디에, 어떻게 사용됐는지 알 권리를 잃게 될 뿐만 아니라, 정당한 대가 요구도 어려워진다”고 설명했다. “생성형 AI 사업자가 최대한 학습 데이터를 투명하게 밝히고 저작권자가 열람할 수 있도록 해야 한다”며 “생성형 AI 사업자 입장에서도 본인들의 기술에 대한 신뢰도를 높이려면 학습 데이터와 학습 방식 등을 투명하게 공개하는 것이 바람직하다”고 언론단체는 강조했다.
국내외 생성형AI 개발에는 학술 자료와 함께 언론 보도가 주된 학습 데이터로 활용됐다. 최근의 AI 검색에도 언론 보도와 이를 인용한 자료들이 주로 인용되고 있다. 지난 4월 미 하원에서 발의된 ’학습데이터 공개 법안’에도 학습데이터 요약본을 저작권청에 제출하도록 하고 있고, 유럽연합(EU)도 지난 3월 AI학습 데이터 내용을 공개하도록 한 ‘AI법’을 제정했다고 언론단체는 밝혔다.
김지방 디지털뉴스센터장 fattykim@kmib.co.kr