[뉴스룸에서-민태원] 보건의료 빅데이터 활용의 명암

입력 2013-06-23 18:10


구글은 2008년부터 ‘플루 트렌드(www.google.org/flutrends)’를 통해 전 세계 독감 확산 현황을 알리고 있다. 특정 지역에 독감이 퍼지면 미리 예보도 한다. 구글은 독감 증상이 있는 사람들이 늘면 기침, 발열, 몸살, 감기약 등 관련 어휘를 검색하는 빈도가 증가한다는 사실에 착안했다. 이를 통해 시간·지역별 독감 관련 검색어 빈도를 지도에 표시했다. 이 방식으로 2009년 2월 미국 대서양 연안 중부 지역에서 독감이 확산될 것이라고 정확히 예측했다. 미국 질병통제예방센터(CDC)보다 2주 빨랐다.

조만간 우리나라에도 비슷한 서비스가 등장할 것 같다. 국민건강보험공단이 내년부터 독감, 눈병 등 유행성 질병 정보를 미리 알리는 ‘국민건강 주의 예보’ 서비스를 시작하겠다고 최근 밝혔다. 공단이 지난 10년간 축적한 8136억 건의 ‘국민건강정보DB’와 ㈜다음소프트가 보유한 다음카페, 트윗 등 소셜네트워크서비스(SNS) 정보를 융합해 주요 유행병에 대한 위험도를 예보하는 서비스다.

앞서 삼성서울병원은 다음소프트의 1억5000만 건 SNS 분석 데이터와 국가자살통계를 활용해 ‘자살 예보 프로그램’을 개발했다고 발표했다. 역시 SNS상에서의 자살이나 자살 관련 검색어 빈도를 비교하는 방법으로 자살 위험성을 예측할 수 있다는 것이다.

이 같은 서비스가 가능한 배경에는 ‘빅 데이터(Big Data)’가 있다. 빅 데이터는 기존 데이터에 비해 크기가 방대하고 형식이 다양하며 순환 속도가 빨라 일반적인 방법으로는 수집하거나 분석하기 어려운 디지털 데이터를 말한다. 시장조사기관 IDC에 따르면 2011년 한 해 동안 전 세계에서 인터넷을 이용해 만들어진 정보의 양은 총 1.8제타바이트(1조8000억 기가바이트)에 이른다. 이는 한국 전체 인구(2010년 기준 약 4875만명)가 무려 18만년 동안 쉬지 않고 1분마다 트위터에 3개의 글을 게시하는 양과 맞먹는다고 한다.

빅 데이터는 그냥 두면 효용 가치가 떨어지는 정보의 편린일 뿐이다. 하지만 자료들을 서로 조합해서 면밀히 분석해 보면 사회 현상의 방향을 파악하는 정보가 도출될 수 있다는 점에서 중요한 경제적·산업적 가치를 지닌다. 때문에 세계 각국 정부와 기업들이 다양한 분야에서 빅데이터 활용에 눈을 돌리고 있다. 특히 보건의료 분야의 경우 질병 예방과 맞춤형 건강서비스 제공, 의료비 절감 등 그 효과 측면에서 기대감이 높아 주목받고 있다. 우리나라도 올 초 정부 차원에서 보건의료 분야 ‘빅 데이터’ 활용 방안을 모색하고 나섰다.

하지만 빅 데이터의 순기능만 있을까. 일각에서 대규모 정보 수집과 활용으로 인한 ‘사생활 침해’나 ‘모바일 빅 브라더 출현’에 대한 우려가 나오고 있긴 하지만 초기여서 그런지 긍정적 측면만 부각되고 있다는 느낌이다. 보건의료 빅 데이터의 경우 특히 ‘정보의 신뢰성’에 대한 우려를 간과해선 안 된다. 익명성을 바탕으로 의도를 갖고 실제와 다른 정보를 제공할 수 있다는 것이 인터넷을 통해 유통되는 정보의 위험성이다. 특히 SNS는 이성적이기보다는 감성적이고, 심층적이기보다는 피상적 정보가 무차별 확산될 개연성이 커 질병 정보와 지식이 왜곡될 확률이 높다.

질병이나 건강정보는 국민 생명과도 직결된다. 이 때문에 왜곡된 데이터로 인한 ‘잘못된 예측’은 엄청난 결과를 낳을 수 있다. 다른 어떤 분야보다 ‘정보의 신뢰도’를 높이기 위한 기술적, 제도적 보완이 선행돼야 하는 이유다.

민태원 정책기획부 차장 twmin@kmib.co.kr