웹 인프라 기업서 발생한 장애 영향

클라우드 서비스 등 오류 사고 빈번

디지털 인프라 소수 집중 부작용



글로벌 웹 인프라 기업 클라우드플레어에서 발생한 장애로 챗GPT와 엑스(X), 리그오브레전드 등 주요 인터넷 기반 서비스가 다수 마비되는 사태가 발생했다. 클라우드 서비스 오류 등으로 전 세계 소비자들의 일상에 필수적인 사이트가 ‘먹통’이 되는 상황이 반복되고 있다. 디지털 인프라가 소수 서비스에 집중돼 있는 구조가 초래한 초연결시대의 부작용이라는 지적이 나온다.



클라우드플레어의 네트워크 장애는 지난 18일 오후 8시20분(한국 시간 기준) 발생해 19일 오전 2시6분 완전 복구됐다. 클라우드플레어는 웹사이트 데이터를 전달하는 콘텐츠 전송 네트워크(CDN) 기업이다. 전 세계 도메인 네임 시스템(DNS) 트래픽의 20%가량이 클라우드플레어를 거치는 만큼 여기서 장애가 생기면 인터넷 서비스 상당수가 멈추게 된다. 이 여파로 챗GPT와 엑스 구글 유튜브 게임 등 인터넷을 기반으로 한 서비스가 전방위적으로 마비됐다.



최근 들어 주요 인터넷 서비스가 마비되는 사고가 빈번해 지고 있다. 특히 클라우드 제공 기업의 오류는 더욱 치명적이다. 지난달에는 전 세계 클라우드 시장 점유율 1위인 아마존웹서비스(AWS)와 2위 마이크로소프트 ‘애저’의 서비스 오류가 잇따라 발생했다. 해당 클라우드 서비스를 사용하는 기업들의 서비스는 즉각 중단됐다. 항공사 발권 시스템이나 결제 서비스가 마비되면서 전 세계 기업들과 소비자들이 피해를 입었다. 국내에서도 삼성페이가 먹통이 되면서 이용자들이 불편을 겪었다. 지난해에는 사이버 보안 회사 크라우드스트라이크 오류로 전 세계 컴퓨터 시스템이 마비돼 수천 건의 항공편이 지연되거나 취소됐다.



장애의 원인은 해킹 등 외부 공격보다는 내부적 문제에 따른 경우가 많다. 단순한 업데이트 오류가 대규모 먹통 사태를 부르거나, 설정 변경 중 실수가 전체 네트워크 장애로 이어지는 것이다. 클라우드 인프라가 지나치게 복잡해지면서 오류가 발생해도 곧바로 원인을 찾기 어려운 경우도 있다. 매튜 프린스 클라우드플레어 최고경영자(CEO)는 “처음에는 대규모 디도스 공격으로 오인했지만 이번 오류는 사이버 공격으로 발생한 것이 아니다”라며 “데이터베이스 시스템 권한이 변경되면서 소프트웨어가 대응을 제대로 하지 못했다”고 밝혔다.



단일 기업의 서비스 오류가 전 세계에 파장을 미치는 것은 온라인 서비스가 소수의 인프라 제공 업체에 과의존하는 구조 영향이 크다. 클라우드 서비스는 대규모 인프라가 필요해 일반 기업들이 자체적으로 구축하기 어렵다. AWS·마이크로소프트·구글클라우드 등이 전 세계 클라우드 시장을 장악한 이유다. 오류의 빈도를 줄이기 위해서는 다른 클라우드 서비스를 백업용으로 활용하는 식의 대응이 필요하다.



업계 관계자는 “클라우드나 네트워크 오류가 발생하는 것 자체를 원천적으로 막기는 어렵다”며 “주요 기업들은 서비스 장애에 대비해 백업을 잘 구축하고 기민하게 대응하는 시스템을 갖춰야 한다”고 말했다.



심희정 기자 simcity@kmib.co.kr



