국가가 지역별로 어떤 질병이 가장 많이 발생하고 있는지 파악할 수 있다면 그 지역의 특성에 맞게 의료 정책을 펼 수 있을 것이다. 그렇다면 어떻게 지역별 발병 현황을 한눈에 알 수 있게 시각화할 수 있을까. 우선 행정 데이터 중 하나인 국민건강보험공단의 질병 데이터를 활용하면 지역별 발병 현황을 알 수 있다. 그러나 이 데이터엔 주소 정보만 있어 바로 시각화할 수는 없다. 이때 이동통신사의 세밀한 지도 같은 공간 데이터를 활용할 수 있다. 이통사의 공간 데이터에 국민건강보험공단의 질병 데이터를 매핑(Mapping·지도 그리기)하면 지역별로 시각화된 질병 데이터가 완성된다.
정부가 이처럼 행정 데이터에 민간의 데이터를 연계해 새로운 통계를 만들기로 했다. 지금까지 정부 기관은 외부 기관에 용역을 줘 민간 빅데이터를 활용해 왔지만, 활용 폭은 크지 못했다. 하지만 호주 캐나다 등 선진국들은 이미 정부 차원에서 민간 빅데이터 분석을 해오고 있다. 이를 위해 정부는 9월 중 통계청에 빅데이터 분석 전담 부서를 만들기로 했다. 현재의 통계정보국을 통계허브국으로 이름을 변경하고 국 아래에 ‘빅데이터 분석과’(가칭)를 신설할 계획이다.
정부는 이를 통해 행정 데이터와 민간 데이터를 연계해 통계를 작성할 계획이다. 지금까지 정부 기관은 행정 데이터만 이용해 통계를 작성하고, 민간 기업은 자신들이 생산한 데이터만 활용해 통계를 작성할 수밖에 없었다. 행정 데이터는 민간에 공개되지 않는 경우가 많았고, 정부는 민간 데이터에 큰 관심을 가지지 않았기 때문이다. 통계청은 앞으로 행정 데이터와 민간 데이터가 연계돼 만들어지는 ‘제3의 빅데이터’의 가치가 무궁무진할 것으로 기대하고 있다. 실제로 서울시의 심야버스 노선 수립 과정에서 활용된 빅데이터는 서울시의 교통 데이터와 이동통신사 KT의 유동인구 데이터를 합쳐 만들어졌다.
아울러 통계청은 민간의 빅데이터 분석 결과를 사후 검증하는 구상도 가지고 있다. 예를 들어 최근 포털 사이트들이 검색 키워드 빅데이터를 활용해 독감 유행을 예측하고 있다. 그러나 실제로 이 예측 시스템이 맞는지 검증할 수 있는 방법은 없었다. 반면 정부 기관은 실제 독감 치료 관련 행정 데이터를 가지고 있는데, 이 행정 데이터를 활용하면 민간 기업들의 빅데이터 분석이 맞았는지 확인할 수 있다. 또 국민을 대상으로 공개되는 공공 데이터의 품질을 높이는 방안도 계획 중이다. 그러나 이 청사진을 이루기 위해서는 민간의 협력이 필수적이다. 행정 데이터와 민간 데이터의 연계 분석 과정에서 민간 데이터를 얼마나 확보할 수 있느냐가 성패를 좌우하기 때문이다. 통계청 관계자는 2일 “민간 기업들은 자신들이 생산한 빅데이터를 개인정보는 암호화해서 파는 경우가 최근에 많은데 이를 사오기 위한 예산 확보가 중요하다”며 “또 데이터 확보를 위해 민간 기업의 협조를 어떻게 이끌어낼지가 앞으로 과제”라고 말했다.
세종=윤성민 기자 woody@kmib.co.kr
정부 “행정·민간 빅데이터 연계”… 맞춤형 통계 만든다
입력 2015-08-03 02:31