미래를 예측하는 것은 인간의 오랜 숙원이었다. 당장 눈앞에 벌어질 상황들을 미리 알 수 있다는 것은 공상과학(SF) 영화 속 이야기처럼 느껴진다. 하지만 일상생활에서 우리는 이미 미래를 예측하는 서비스를 접하고 있다. 몇 시간 뒤 서울에 내릴 비의 양을 날씨 예보를 통해 알 수 있고, 매일 다니는 출근길의 도착 예상 시간을 계산할 수 있다. 이 모든 것이 바로 방대한 데이터를 통해 미래를 가늠하는 ‘빅데이터’ 활용 사례다.
빅데이터의 활용 분야는 날씨 예보나 교통 수요 예측 외에도 무궁무진하다. 카드사나 통신사가 수집한 민간 정보도 많지만 국민연금 가입 정보, 교통카드 사용 위치·시간, 건강보험 가입 내역 등 공공에서 수집된 정보 역시 그 규모를 가늠하기 어려울 정도로 방대하다. 이렇게 수집된 공공데이터는 보다 나은 정책과 제도를 만드는데 활용할 수 있다는 얘기이기도 하다.
선제적 대응 열쇠, 빅데이터 행정
국민연금공단은 경기도 남양주시와 협업을 통해 지난해부터 잠재적 사회 취약계층을 위한 일자리 창출 및 지원 사업을 벌이고 있다. 일자리를 원하는 취약계층이 직접 구직 활동을 벌이지 않아도 자립을 위한 일자리 창출을 돕는다는 취지다.
기존 지자체 고용복지센터들은 일자리 상담을 제공하거나 사업장을 직접 방문해 구직자와 사업장을 연결시켜주는 일을 수행해왔다. 센터에 방문하는 실업자들을 기다리던 수동적인 행정에 머물 수밖에 없었지만 빅데이터를 활용하면 맞춤형 일자리 연결이 가능해진다.
이를 위해 두 기관은 지역·사업장 가입자 현황과 관리대상자 주소·재산 등 가입내역, 가입자별 사업장 정보, 사업장별 근로자수, 사업장 등록 형태 등 국민연금공단의 데이터와 남양주시가 보유한 최근 1년간 구직자 성명, 학력, 성별 등을 토대로 분석 모델을 만들었다. 실직자 중 세대 수입액(월 기준)이 보건복지부 기준 가족 수에 따른 최저생계비용보다 적은 세대 주민을 대상으로 이들 관내·외 사업장 중 전월 대비 취업자 및 실직자 증가가 높은 상위 사업장을 뽑아 매칭하는 방식이다.
취업활동을 지원하는 희망일자리 상담소 역시 실업자 분석 자료를 기반으로 실직자 밀집 지역이나 실업증가율이 높아지는 곳에 설치하는 등 빅데이터를 활용했다. 국민연금공단 자체 빅데이터 플랫폼에서 가입자 및 사업장 데이터를 수집·저장·처리·분석한 뒤 그 결과를 지역정보개발원에 제공하고 이 내용이 취약계층 우선 취업지원 활동에 활용되는 방식이다.
CCTV 설치에도 빅데이터가 활용된다. 곳곳에서 CCTV 설치 요구는 늘어나고 있지만 한정된 예산에서 보다 최적화된 위치를 찾는 것은 지자체의 고민이었다. 대부분 민원이 집중되는 특정 지역에만 CCTV가 설치되는 경우가 많고 방범 효율성이 떨어진다는 지적이 꾸준히 제기돼왔다.
경기도는 2015년부터 CCTV 설치 현황, 유동 인구 데이터, 가구·지역 특성과 공간적 연관성을 반영한 분석을 통해 CCTV 우선설치 지역 및 CCTV 운영관리 대상을 선정해오고 있다. CCTV 설치 현황, 가로등 보안등 설치 현황, 학교 현황, 도시개발정보 등 14종의 공공데이터와 통신사 유동인구 등 12종의 민간 데이터를 활용해 기존 CCTV와의 거리, 범죄 발생률 가중치 등을 고려한 지역을 추출하는 방식이다. 경기도는 분석 결과를 반영해 CCTV를 우선 설치하고, 설치 요청 민원이 발생하는 경우 분석 결과를 토대로 타당성을 검토해본 뒤 설치를 결정하고 있다.
지난 16일 서울 광화문 정부서울청사 별관에서 개최된 ‘공공 빅데이터 우수사례 경진대회’에서는 일반 행정뿐 아니라 국민 안전과 직결되는 주제의 활용 사례도 공개됐다. 행정안전부가 주최하고 한국정보화진흥원(NIA)이 주관한 이날 행사에서는 교통사고를 유발하는 ‘포트홀’ 복구 작업에 빅데이터를 활용하는 한국도로공사의 도로포장파손 탐지 시스템, 전북도의 구급차 배치·운영을 위한 빅데이터 활용 사례도 공유됐다.
모아서 분석해야 의미 있는 빅데이터
정보통신(ICT)기술이 발전하면서 매일 다양한 종류의 데이터들이 유통되고 있다. 방대한 데이터들은 흩어져 있으면 단순 자료에 불과하다. 하지만 이를 모아서 분석하면 미래를 예측할 수 있는 힘이 생긴다. 빅데이터 분석을 통해 아이디어를 발굴할 수도 있고 맞춤형 서비스 제공, 상황에 대한 선제적 대응이 가능해진다.
국가에서 보유하고 있던 공공데이터가 개인이 특정되지 않는 비식별 정보로 가공돼 민간에 제공되면서 활용 영역도 넓히고 있다. 올해는 국가가 보유하고 있던 공공데이터를 국민에 개방한 지 5년차에 접어들었다. 공공데이터 개방 플랫폼인 공공데이터포털을 통해 개방된 데이터(올해 8월 기준)는 초기보다 파일 건수는 4.3배, 데이터 활용을 위한 다운로드 건수는 226.5배 증가했다. 공공의 데이터를 활용해 민간 아이디어를 접목한 사례들도 늘어나고 있다.
한·중·일 통합 외식 마케팅 플랫폼 서비스를 제공하고 있는 ‘레드테이블’은 공공데이터를 활용해 폭발적으로 성장한 대표적 사례다. 외식 산업은 규모 면에서는 크지만 상대적으로 정보화나 IT기술 접목 사례가 많지 않은 분야이기도 하다. 레드테이블은 주로 한국에 오는 중국인 관광객(유커)을 대상으로 빅데이터 분석을 통해 한국 젊은 사람들이 즐겨 찾는 레스토랑의 랭킹을 공개하고 이를 중국어로 번역해 콘텐츠를 제공하고 있다. 골목에 숨은 맛집들의 경우 중국어 메뉴판이 구비되지 않은 경우가 많기 때문에 레드테이블 앱을 통해 중국어 메뉴도 제공하고 있다. 더 나아가 예약과 모바일 결제 서비스까지 제공하고 있다. 레드테이블은 벤처투자사로부터 11억원의 투자를 받는 데 성공했고 지난해 중국 최대 O2O(온·오프라인 연계)기업인 다중디엔핑과 음식 관광 상품 판매계약도 체결했다.
레드테이블이 이렇게 급성장 할 수 있었던 배경에는 바로 공공데이터가 있었다. 표준 메뉴명과 메뉴 설명의 경우 한국관광공사와 한식재단에서 표준화한 데이터(Tour API)를 이용했다. 정부가 제공하는 메뉴 관련 정보가 300여개인데 이를 활용한 것이다. 여기에 서울시가 오픈한 상권분석 정보 시스템을 활용했고 위치 정보와 지하철 정보를 연동시켰다. 개인이 직접 지도 정보부터 교통 관련 서비스까지 개발하는 것은 힘들지만 공공데이터를 활용해 훨씬 효율적으로 작업할 수 있게 된 것이다. 김일재 행안부 정부혁신조직실장은 “국민 수요와 활용도가 높은 공공데이터를 지속적으로 개방함과 동시에 데이터 기반 과학적 행정을 추진해 국내 빅데이터 활용 활성화에 나설 것”이라고 밝혔다.
글=김유나 기자 spring@kmib.co.kr, 그래픽=안지나 기자
빅데이터로 찾아낸 ‘유커 입맛’… 이를 가능케 한 공공데이터
입력 2017-11-22 05:01