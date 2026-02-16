생성형 AI가 생성한 인용, ‘가짜’ 비율 최대 95%

AI 활용해 1년에 책 9000권 펴내기도



생성형 인공지능(AI)이 창작 생태계 ‘공해’가 됐다는 목소리가 나온다. 존재하지 않는 논문을 참고 문헌으로 쓰는 ‘유령 인용’ 문제는 이미 심각한 수준에 이른 것으로 나타났다. AI로 단기간에 저품질 도서를 대량으로 쏟아내는 ‘딸깍 출판’ 역시 논란이 됐다.



중국 난카이대와 칭화대 공동 연구팀이 자체 개발한 시스템 ‘CITEVERIFIER’로 검증한 결과, 여러 AI 모델은 적게는 14%에서 많게는 95%까지 허위 인용을 생성하는 것으로 나타났다. 연구팀은 GPT-5와 클로드4, 제미나이 등 13개 대규모언어모델(LLM)을 대상으로 40개 컴퓨터 과학 연구 분야에서 37만5440개의 인용을 생성한 뒤 진위 여부를 따져봤다. 조사 대상 모델은 모두 허위 인용을 출력했다. 딥시크의 환각 인용률이 14.23%로 가장 낮았고, 텐센트 훈위안 모델 경우 수치가 94.93%에 달했다. 비교적 최신 모델인 GPT-5와 클로드4도 각각 50.92%, 21.84%의 환각률을 기록했다.



연구팀은 또 2020년부터 2025년까지 최상위 AI·머신러닝·보안 학회에 발표된 5만6381편의 논문에서 의심스러운 2530개 인용을 골라냈다. 연구진은 약 한 달간 수작업으로 재검증을 진행해 604편 논문에서 739개의 확실한 허위 인용을 확인했다. 이 중 486편은 추적 불가능한 유령 인용을, 133편은 메타데이터 오류를 포함하고 있었다. 아울러 2020년부터 2024년까지 허위 인용률은 0.76%에서 0.98% 사이를 오갔지만, 2025년에 들어서는 1.61%로 급등했다. 직전 5년 평균인 0.89% 대비 80.9%가 증가한 수치다.



연구자들도 충분한 검증 없이 AI가 생성한 참고문헌을 그대로 사용하는 것으로 드러났다. 연구팀은 97명의 연구자를 대상으로 설문조사를 실시했다. 응답자의 87.2%는 연구에 AI 도구를 사용하고 있다고 답했으며, AI를 활용하는 연구자 중 86.7%는 “항상 결과물을 검증한다”고 주장했다. 그러나 연구자들의 실제 행동 데이터는 다른 양상을 보였다. 전체의 41.5%는 AI가 생성한 서지 정보 항목을 내용 확인 없이 복사해 붙여넣었고, 17.3%는 AI가 추천한 논문을 읽지도 않고 인용했다. 연구팀은 “AI 도구와 연구자들의 불완전한 검증, 부족한 심사 과정이 합쳐져 조작된 인용이 과학 기록을 오염시키는 심각한 위기가 가속화되고 있다”고 우려했다.



출판사 루미너리북스는 생성형 AI를 활용해 한 해 약 9000여권의 책을 펴냈다. 16일 교보문고에서 판매되고 있는 루미너리북스의 출판물. 교보문고 웹사이트 캡처

클릭 한 번에 책 한 권이 뚝딱 나오는 ‘딸깍 출판’도 화제다. 출판사 루미너리북스 경우 생성형 AI를 활용해 한 해에 약 9000여권의 책을 펴낸 것으로 알려졌다. 업계 환경을 교란한다는 비난이 거세지자 해당 출판사는 지난 2일 홈페이지에 공식 입장문을 발표했다. 루미너리북스 관계자는 “단순히 책을 많이 출판하는 것 자체가 목표가 아니다”라며 “출판사가 추구하는 장기적 비전은 한국어에 특화된 AI 언어모델 개발을 통한 한국 AI 기술 발전 기여”라고 해명했다.



출판계에서 AI 활용은 이미 ‘거스를 수 없는 흐름’이 됐다고도 주장했다. 루미너리북스는 “기존 출판사들의 다수 베스트셀러에서도 텍스트 부분이 AI로 작성된 것으로 추정되는 사례가 발견되고 있다”며 “AI는 이미 출판을 포함한 다양한 산업에서 생산성과 품질을 높이는 유용한 도구로 자리 잡았다”고 밝혔다.



국립중앙도서관은 AI가 생성한 출판물에 대응하기 위해 지난 3일 제도 전반을 손보겠다는 계획을 밝혔다. 출판 동향 모니터링을 강화하고, 국제표준도서번호(ISBN) 발급 건수가 평균치를 크게 웃도는 출판사에 한해서는 납본 대상 여부를 면밀히 검토할 예정이다. 납본 제도는 국내에서 발행 및 제작된 도서관 자료를 발행일로부터 30일 이내에 국립중앙도서관과 국회도서관에 의무 제출하도록 한 제도다. 납본이 완료되면 도서 정가 상당의 보상금이 지급되는데, AI를 활용한 대량 출판 경우 해당 제도를 악용하고 있다는 지적이 제기되기도 했다.



박선영 기자 pomme@kmib.co.kr



