‘빅’데이터의 ‘큰’ 위험…과신하면 위험

입력 2015-02-03 17:23 수정 2015-02-03 21:08

인터넷과 소셜네트워크서비스(SNS)의 발달로 인해 의사결정 수단으로 최근 광범위하게 각광받고 있는 ‘빅데이터’(big data·디지털 환경에서 생성된 방대한 규모의 데이터)가 그 유용성만큼이나 ‘큰 위험성’을 동시에 갖고 있다는 주장이 제기됐다.

미국 CNN 인터넷판은 2일(현지시간) 국제안보 전문가인 콘스탄틴 카케스를 인용해 빅데이터가 사회·경제적 가치를 측량해 특정 사안을 판단하고 결정하는데 유용한 도구로 쓰이지만 과신한다면 “방대한 데이터의 양 때문에 오히려 더 큰 그림을 놓치게 될 수 있다”고 지적했다.

빅데이터는 많은 공공분야에서 ‘증거기반 정책’을 수립하는데 영향을 미치고 있다. 지난해 발간돤 백악관 보고서는 “빅데이터가 시민의 경제적 역동성을 활성화해 진보의 역사를 촉진할 것”이라고 평가하기도 했다.

하지만 카케스는 이 같은 사회·경제적 가치를 창출하려면 “개인의 사생활과 공정성, 형평성, 자율성 등 여러 핵심가치 사이에 균형을 잡아야 한다”는 단서를 붙였음에도 그것이 얼마나 어려운 일인지를 보고서는 간과하고 있다고 꼬집는다. 빅데이터의 정량 분석에는 여러 한계가 발생하기 때문에 “잘못된 정보의 사용이 때로는 아예 정보가 없는 것보다도 더 위험하고 해로울 수 있다”는 것이다.

그는 지난달 말 뉴욕타임스에 실린 마리사 메이어 야후 CEO의 사례에 주목했다. 구글에서 야후로 이적한 스타 경영인 메이어는 사내 모든 직원의 매 분기별 실적 데이터에 대해 1~5등급으로 순위를 매겨 성과를 독려하고 실적이 부진한 직원을 걸러내려 시도했다. 하지만 4~5등급의 평가를 받을 것을 우려한 직원들이 더 이상 협업을 하려 하지 않았다. 팀워크는 와해돼 버렸고 메이어는 자신의 방식을 포기해야 했다.

이처럼 단순히 양적 측정기술로 성과를 환원하려는 노력은 어느 순간 잘못된 결과로 이어질 수 있다는 점이 빅데이터 회의론의 핵심이다. 이밖에 수치로 전환하기 어려운 숙련도나 기술적인 부분들을 수량화하는 문제, 세부적인 데이터 수집 방식에 따라 얼마든지 원하는대로 결과를 조작하거나 호도할 수 있다는 점도 빅데이터 활용의 한계이자 난점으로 평가된다. 이를테면 우리 주변에서 흔히 접할 수 있는 서비스 만족도에 대한 고객 평가가 형식적 답변과 데이터 위·변조로 인해 기업의 판단준거로 온전히 작용하지 못하는 사례가 이에 해당한다.

때문에 빅데이터만으로 답을 구하기 어려운 가치판단, 맥락, 가산치가 고려돼야 할 의사결정의 경우 마냥 “자료가 풍성하다”는 이유로 빅데이터 결과물을 채택해선 안된다는 지적이 나온다.

정건희 기자 moderato@kmib.co.kr