행정전산망 장애 예방 등을 담은 정부의 디지털 서비스 ‘매뉴얼’이 최근까지 업데이트를 거쳐 배포된 것으로 확인됐다. 과거 정부의 서비스 장애 교훈을 담아 작성한 매뉴얼이 있음에도 이번 전산망 장애 사태에서는 무용지물이었다. 이번 사태의 근본 원인이 정부의 총체적 관리 부실이라는 지적이다.
20일 국민일보 취재를 종합하면 국가정보자원관리원(국자원)은 지난 8월 “국가정보자원관리원에 축적된 대규모 서비스 노하우를 확산하겠다”면서 ‘디지털 정부서비스 설계·구축·운영 매뉴얼’을 모든 중앙부처와 시·군·구 등 지방자치단체에 배포했다. 이 매뉴얼은 지난해 8월 처음 만들어졌고, 1년 동안 수정 및 보완 작업을 거친 2번째 버전이다. 지난해 6월 행정안전부 차관의 지시에 따라 매뉴얼을 작성한 뒤 전 부처에 공유한 것으로 전해졌다. 국자원은 매뉴얼에 “그동안 국자원에 축적된 노하우를 전 부처에 확산해 안정성을 높여야 한다”며 작성 배경을 설명했다.
국자원은 특히 코로나19에 대응하며 정부가 내놨던 신규 서비스가 개통 후 폭증한 수요를 감당하지 못해 먹통이 되는 등 과거 장애 사례에 대한 사후 개선 방안을 이번 2번째 매뉴얼에 담았다. 정부 디지털 서비스를 어떤 규격과 용량, 운영방식으로 설계하는지, 서비스를 개선하거나 업데이트하기 전 어떤 과정을 거쳐야만 문제가 발생하지 않는지 상세히 적었다. 예를 들면 메뉴얼에는 ‘최초 개통 3주 전까지 개발을 완료하고 실제 개통했을 때와 동일한 테스트 환경을 준비해야 한다’거나 ‘테스트는 10시간 이상 충분한 시간을 확보해야 한다’는 식으로 부하에 대한 점검이 사전에 철저해야 한다고 명시했다.
또 서비스를 시작한 이후 문제가 발생하지 않도록 모니터링하는 시스템의 중요성도 담겨져 있었다. 실시간으로 시스템 상황을 확인하기 위한 서버 모니터링 시스템을 필수로 구축해야 한다는 것이다. 메뉴얼은 ‘보도자료, 카드뉴스, 문자메시지 등 다양한 홍보 수단을 통해 사용자가 언제 접속해야 하는지 사용자 분산정책을 홍보해야 한다’며 장애 발생 상황에 대한 대처법을 구체적으로 적시했다.
이 때문에 매뉴얼만 제대로 작동했다면 ‘전산망 마비’가 장기화하지 않았을 것이란 지적이다. 한 정보기술(IT)업계 관계자는 “실시간 모니터링 시스템이라도 제대로 작동했다면 문제 원인을 빠르게 파악하고 해결책도 곧바로 제시할 수 있었을 것”이라며 “매뉴얼만 지켜졌더라도 충분히 예방할 수 있었던 사태”라고 말했다.
전성필 기자 feel@kmib.co.kr