데이터센터 화재에 ‘국민메신저 먹통’… 재난대응 부실 논란

입력 2022-10-16 15:07 수정 2022-10-16 16:21

‘국민메신저’ 카카오톡이 10시간 가량 서비스 장애가 발생해 전 국민이 큰 불편을 겪었다. 카카오톡을 기반으로 하는 다양한 부가서비스도 장애가 발생해 피해가 눈덩이처럼 커졌다. 카카오의 재난복구(DR·Disaster Recover) 시스템이 제대로 작동하지 않았다는 비판이 나온다.

16일 업계에 따르면 전날 오후 3시30분쯤부터 발생한 카카오톡 서비스 장애는 이날 오전 2시쯤부터 복구되기 시작했다. 오후 2시 기준으로 카카오톡의 경우 메시지 송수신은 정상적으로 이뤄지지만 사진과 동영상 전송은 복구 중이다. 카카오페이, 카카오T, 멜론, 카카오웹툰 등 서비스도 하나둘 정상화하고 있다. 하지만 카카오는 서비스 완전 복구 시기는 정확히 알 수 없다는 입장이다. 남궁훈 카카오 대표는 “데이터센터 한 곳 전체가 영향을 받는 것은 이례적인 상황으로, 해당 조치를 적용하는데 예상보다 오랜 시간이 소요되고 있다”고 밝혔다.

이번 사고는 카카오톡 서비스 개시 이후 가장 긴 시간 발생한 장애다. 국내 IT업계 전체를 봐도 10시간 가량 서비스 장애가 발생한 사례는 찾기 어렵다. 때문에 카카오의 DR 시스템이 부실하다는 비판이 나온다.

사고는 SK㈜ C&C의 판교 데이터센터 화재가 원인이 됐다. 카카오는 이곳에 3만2000개 가량의 서버를 운영하고 있다. 화재로 정전이 되면서 서버가 작동을 멈춰 서비스가 제대로 이뤄지지 않았다는 것이다.


하지만, 같은 데이터센터를 쓰는 네이버의 경우 서비스 장애가 몇 시간 만에 정상 복구됐다는 점에서 카카오의 대응이 미흡했다는 지적이 나온다. 네이버는 춘천에 2013년 완공한 자체 데이터센터 ‘각’을 비롯해 여러 곳에 데이터와 서비스 요소 등을 분산 저장해두고 있다. 한 곳에 문제가 생기면 다른 쪽 데이터센터를 통해 서비스를 복구하고 정상 운영한다.

DR은 지진, 정전 등 천재지변에도 서비스를 정상적으로 운영할 수 있도록 대비하는 것을 의미한다. 대응수위에 따라 실제 가동되는 서버와 동일하게 데이터를 백업하는 ‘미러사이트’, 시스템 장애에 대비해 데이터와 서버 등을 설치한 ‘핫사이트’, ‘웜사이트’, ‘콜드사이트’ 등이 있다.

한 IT 업계 관계자는 “카카오톡 정도 규모의 서비스는 미러사이트 운영에 막대한 비용이 들 수 있어 어려움이 있을 것”이라면서도 “서비스가 10시간이나 복구가 안 됐다는 건 DR 시스템이 제대로 갖춰져있지 않다는 얘기”라고 꼬집었다.

윤석열 대통령은 “카카오, 네이버 등의 디지털 부가 서비스 중단으로 우리 국민께서 겪고 계신 불편과 피해에 대해 매우 무겁게 느끼고 있다”며 “정확한 원인 파악은 물론, 트윈 데이터센터 설치(이원화) 등을 포함한 사고 예방 방안과 사고 발생 시 보고·조치 제도 마련도 철저히 이뤄져야 한다”고 강조했다. 또, 과학기술정보통신부 재난상황실을 장관 주재로 격상해 지휘하라고 지시했다.

이종호 과기부 장관은 이날 “이번 서비스 장애 사태로 국민들이 큰 불편을 겪게 된 데 대해 주무 장관으로서 막중한 책임을 통감하며 사과드린다”고 사과했다. 이 장관은 “그동안 부가통신서비스가 기간통신서비스에 비해 법률상으로 중요도가 낮다고 생각돼 왔지만 이번에 보았듯 부가통신서비스의 안정성 무너지면 우리의 경제·사회 활동이 마비될 우려가 있다”면서 제도 보완 가능성도 시사했다. 현행 방송통신발전기본법 상 방송통신재난관리기본계획의 대상에는 카카오, 네이버 같은 부가통신사업자가 포함되지 않다.

김준엽 기자 snoopy@kmib.co.kr