서울 종로에서 혈투를 벌이고 있는 차기 대권 잠룡에 대한 디지털 민심 빅데이터 분석에서 긍정·부정 추세는 선거가 임박할수록 굳어지는 양상이 나타났다. 더불어민주당 이낙연 후보에 대한 긍정 감성 평가는 꾸준히 30%대를 유지해 왔다. 반면 미래통합당 황교안 후보는 선거운동 기간 내내 부정 평가가 긍정 평가를 큰 폭으로 압도해 왔다.
다만 공식선거운동 직후 이 후보는 부정 평가가 증가하는 추세를 보였다. 황 후보는 선거운동 초기에 비해 부정평가가 다소 감소하는 추이를 보였지만 당내 여러 논란이 영향을 끼치며 전체 판세를 바꾸지는 못한 것으로 조사됐다.
지난달 20일부터 지난 9일까지 21일간 수집된 종로 관련 문서에서 이 후보에 대한 긍정 감성 비중은 32.0%로 나타났다. 부정 감성 비중은 36.6%로 4.6% 포인트 높았다. 같은 기간 추출·분석한 문건에서 황 후보의 경우 긍정, 부정 감성 비중이 각각 21.8%, 46.2%로 분석됐다. 두 후보 모두 부정 감성이 긍정 감성보다 우위에 있지만 그 폭은 황 후보가 더 컸다.
이 후보는 긍정 감성 변화가 크지 않았지만 투표일이 임박하면서 부정 감성이 소폭 증가하는 양상을 보였다. 반면 황 후보는 부정 비중의 등락폭이 컸다. 선거운동이 막바지에 오면서 소폭 하락하는 모습도 보였다.
이 후보에 대한 부정 감성은 조국 전 법무부 장관과 민주당의 비례정당 참여 문제를 언급했던 지난 3월 19~20일, 재난소득 입장을 밝혔던 27일 큰 폭의 증가세를 보였다. 선거 10여일을 앞둔 지난 2일부터 부정 감성어가 증가하고, 긍정 감성은 다소 감소하는 추세도 일부 보였다. “황교안 너무 미워하지 마라” 발언이 화제가 됐던 지난 4, 5일에는 부정 감성이 긍정 감성을 압도했다. 황 후보와의 토론회 다음날인 7일에도 비슷한 추이가 관측됐다.
황 후보는 비례한국당 공천 논란으로 3월 내내 부정 감성이 크게 늘었다. 공천을 마무리한 뒤로는 부정 감성이 줄었지만 공식선거운동 시작을 기점으로 발생한 당내 구설이 다시 부정 평가를 증가시켰다. 4월 2일 방송기자클럽 초청 토론회에서 ‘종합부동산세 완화’ 언급이후 여권 지지층의 부정 감성 표현이 잦아졌다. ‘n번방 호기심’ ‘키 작은 사람 투표용지’ 등 발언 논란 역시 부정 감성 비율을 높였다. 특히 황 후보는 당내 막말 논란이 불거진 뒤 부정 감성이 급증하는 현상도 나타났다. 최근에는 황 대표가 메시지 관리에 들어가면서 부정 감성 비율이 조금씩 줄었다.
김택환 경기대 교수는 “당 대표로서 크고 작은 사건과 비난들이 황 대표에게 부정 감성 인식이 늘어나는 구조로 나타나고 있다”고 분석했다.
국민일보와 CBS가 조원씨앤아이에 공동 의뢰해 지난 4~5일 종로 거주 18세 이상 500명을 대상으로 진행한 여론조사 결과에서 이 후보(52.2%)와 황 후보(37.1%) 격차는 15.1% 포인트였다.
어떻게 분석했나
국민일보는 경기대 빅데이터센터(센터장 장석진) 김택환 교수팀과 공동으로 지난달 20일부터 지난 9일까지 SNS상에 올라온 주요 격전지 6곳 후보자에 대한 유권자 평가글 52만여 건을 텍스트 마이닝(text mining) 기법으로 추출해 분석했다. 트위터, 블로그, 인스타그램 등을 대상으로 ‘감성 연관어 분석’ 방식을 적용했다. 글에 나타난 긍·부정 감정 평가 알고리즘을 만들어 점수화한 것으로 2012년 미국 대선에서는 오바마 캠프가 여론 파악을 위해 활용했었다. 유권자가 설문에 답하는 여론조사와는 달리 SNS 상에 드러난 유권자 감정을 직접 분석, 디지털 민심을 유추하는 기법이다. 조사는 웹데이터 수집 전문회사 리스틀리와 빅데이터 분석 업체 언노운데이터에 의뢰했다.
텍스트 마이닝 기법으로 추출한 감성 빅데이터 분석에서는 부정 감성 연관어 비중이 당락 예측의 가장 중요한 기준이 된다. ‘싫다’ ‘나쁘다’ 같은 부정 표현이 ‘좋아요’ 같은 긍정 표현보다 감정 표출 면에서 적극적이기 때문이다.
데이터 분석업체는 긍정 부정의 감성어 비중이 하루 이틀 요동치고 원래자리로 돌아오는 현상은 당락에 큰 의미가 없다고 보고 있다. 후보자에 대한 감정이 굳어지는 추세가 중요하기 때문이다. 그래서 이슈가 터진 뒤 곧 사라지는 키워드들은 표준편차값을 통해 제거했다.
지난 20대 총선 데이터를 기반으로 모델링을 했을 때도 일시적 요동은 당락에 큰 영향을 미치지 못한 것으로 분석됐다. 다만 유권자 감정에 영향을 미치는 이슈 발생 이후 추세가 움직이면 분석가치가 높다. 선거일에 임박해 긍정 비율이 급증할 경우 실제 당선에도 긍정적인 영향을 미치는 것으로 예측된다. 한 후보에 대한 부정적 감성이 늘어나는 추세라고 해도, 상대편 후보가 비슷하게 늘어가고 있으면 상쇄된다.
▶
▶
▶
▶
▶
▶
전웅빈 기자 imung@kmib.co.kr