디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

”제2의 카카오 먹통 사태 막아야”…해법은 철저한 ‘이중화’

IT동아갤로그로 이동합니다. 2022.10.20 18:55:46
조회 177 추천 0 댓글 0
[IT동아 김동진 기자] 일상을 무너뜨린 ‘카카오 먹통 사태’의 원인이 무엇일지 관심이 뜨거운 가운데 철저한 재발 방지책을 세워야 한다는 목소리가 높다. 모든 국민이 한 회사의 플랫폼에 종속될 경우, 국가 재난 사태가 발생할 수 있음을 경험했기 때문이다. 카카오 먹통 사태의 재발 방지를 위해 필요한 사항과 추정되는 화재 원인을 데이터센터 구성과 함께 살펴봤다.


SK C&C 판교 데이터센터 지하 3층 전기실 내 비상 축전지가 불에 탄 모습(왼쪽), 합동감식반이 1차 현장 감식을 위해 건물로 향하는 모습. 출처=윤영찬 더불어민주당 의원 페이스북·사진공동취재단



데이터센터가 뭐길래

카카오 먹통 사태는 지난 15일, SK C&C 판교 데이터센터 지하 3층 전기실 화재에서 시작됐다. 그렇다면 ‘데이터센터가 무엇인지’, ‘현장에 화재를 막을 장치들은 없었는지’ 의문이 남는다.


출처=엔바토엘리먼츠



데이터센터는 기업 정보 또는 기업의 고객 정보 등 각종 데이터를 모아 놓은 시설이다. 인터넷과 연결된 데이터를 저장하려 수만 대의 서버를 24시간 가동해야 하므로, 전기 먹는 하마로 불린다. 데이터센터 기업은 대형 빌딩에 중앙 네트워크를 설치한 뒤 입주기업의 인터넷 서버를 대신 관리하며 수익을 창출한다. SK C&C는 이번 화재가 발생한 데이터센터의 운영사이고, 카카오는 해당 데이터센서의 입주사다.


데이터센터 장비 구성. 출처=한국전자통신연구원



데이터센터는 데이터 저장을 위한 서버와 스토리지, 데이터 전송을 위한 네트워크, 해당 장비들을 유지하기 위한 발전기와 항온·항습기, 무정전 전원장치(UPS Uninterruptible Power Supply, 전자 기기의 전원이 끊겼을 때 일시적으로 전원을 유지해주는 장치. 정전 등에 대비해 전력을 일정 시간 계속해서 공급하는 역할.) 등으로 구성된다. 온도나 습도에 민감한 전자기기 특성상 약 22℃~24℃ 사이 적정 온도 유지를 위해 항온·항습기를 구성에 포함한다.

화재를 막을 수 없었나

데이터센터는 찰나라도 전기가 끊어지면 안 되는 특성이 있어, 화재나 정전 등에 대비한 예비 전력(발전기, UPS)을 필수로 포함한다.

업계 관계자는 “UPS는 소방수를 사용해야 할 정도의 화재를 대비하기 위한 것은 아니다. 쉽게 말해 노트북이라면, 코드가 빠져도 배터리가 있으니 전력이 유지되는 방식이다”라며 “전기가 끊어지면 예비 발전기로 넘어가야 하는데 이 과정에서 30초에서 5분 정도의 빈틈이 생긴다. UPS는 그 빈 시간을 채워주는 역할인데 전원이 모두 차단되면, 이 마저도 소용이 없어 화재 시 초기 진화가 매우 중요하다”고 말했다.

이번 데이터센터 화재가 UPS용 리튬이온배터리에서 시작됐을 가능성이 제기된다. 다만, 배터리관리 시스템(BMS)이나 전선 단락 등도 원인으로 지목되고 있어, 합동감식반의 조사 결과에 관심이 쏠리는 상황이다. SK C&C 측은 “데이터센터 전체 전력을 차단하면서 UPS 또한 작동을 멈췄다”고 밝혔다.

그렇다면 전체 전원을 꼭 차단해야만 했을까. 데이터센터에는 소화 시스템이 갖춰져 있다. 화재가 발생하면, 스프링클러에서 물이 아닌 하론 가스(Halon Gas, 산소를 차단해 불을 끄는 방식.)가 자동으로 살포된다. 수많은 전기 장치를 보호하기 위함인데, 문제는 이 가스를 다 소진해도 불이 꺼지지 않을 경우다. 이번 화재가 이에 해당한다.

소방당국은 판교 데이터센터 스프링클러에 담긴 하론 가스가 모두 소진되자, 물을 쓰기 위해 전체 전원 차단을 요청했다. 전기로 가득한 공간에 물이 흐르면 누전 위험이 있기 때문이다.

혹자는 불이 난 층의 전원만 차단할 수는 없었는지 의문을 제기하지만, 전력망이 촘촘하게 연결돼 있어 불가능하다. 데이터센터 운영사인 SK C&C 측이 화재 초기 관제와 빠른 조치를 취했는지, 그간 화재 초기 진압을 위한 소방 훈련에 충실했는지 의혹이 제기되고 있어 추가 검증이 필요한 상황이다.

먹통 사태 막을 이중화 조치 충분했나

플랫폼 기업은 이번 화재처럼 예비 전력 조치가 작동하지 않을 경우를 대비해 서버와 데이터를 또 다른 데이터센터에 분산하는 이중화 조치를 취한다. 원칙은 평소 운영하는 데이터센터와 이중화를 한 데이터센터를 최소 15km 이상 떨어뜨리는 것이다. 같은 도시에 재난이나 화재가 발생할 경우, 이중화가 무용지물이 되는 것을 막기 위함이다.

일례로 마이크로소프트(MS)는 스코틀랜드 오크니섬 인근 바다에 데이터센터를 구축하는 ‘나틱 프로젝트’를 2015년부터 추진 중이다. 화재로부터 안전한 바닷속에 데이터센터를 구축해 먹통 사태를 막기 위한 조치에 일찌감치 나선 것이다.


컨테이너 형태의 데이터센터를 구축해 해저에 나틱 프로젝트를 진행하는 MS. 출처=MS



MS는 2020년 나틱 프로젝트 2단계 실험 결과를 발표했다. 실험은 총 864대의 서버와 27.6PB(페타바이트) 용량의 스토리지, 냉각 시스템 등을 장착한 약 12미터 길이의 데이터센터 ‘나틱 노던아일(Natick Northern Isles)’을 활용해 진행됐다. 스코틀랜드 오크니섬(Orkney Island) 해저 약 117피트(약 36.5 미터) 지점에 조력, 파력 발전기와 함께 데이터센터를 배치하는 방식이다. 그 결과 MS는 해저 데이터센터가 지상보다 더 안정적이라는 사실을 확인했다고 밝혔다. 고장률이 지상과 비교해 8분의 1 수준이었다고 덧붙였다.

온라인 동영상 서비스(OTT) 기업 넷플릭스는 글로벌 12개 지역에 서버를 분산하고, 해당 인프라가 멈췄을 경우를 가정해 훈련을 주기적으로 진행한다. 이른바 카오스 고릴라 훈련이다.

카카오가 이들 기업처럼 이원화 조치를 충실히 이행했을까. 카카오는 먹통 사태 당시 “이중화 조치를 했지만 데이터의 양과 복잡도, 복구 장비의 특수성 등으로 인해 핵심 서비스의 복구가 지연되고 있다”고 해명했다. 하지만 업계 전문가들의 생각은 달랐다. 김승주 고려대 정보보호대학원 교수는 “이중화 조치를 했다 안했다로 따지기보다는, 어느 정도로 했느냐로 접근해야 할 문제”라며 “이렇게까지 복구가 지연되는 것을 보면, 이중화 조치가 최고 수준은 아니었던 것 같다”고 말했다.

또 다른 업계 관계자는 “카카오가 데이터와 서버를 이중화했지만, 자체 툴 서버가 대부분 판교에 있었던 것으로 알려졌다”며 “이 때문에 전체 서버나 네트워크 장비들의 구성 정보 등에 접근할 수 없는 상태였고, 개발자가 출근해서 복구할 수밖에 없는 상황이었을 것”이라고 추측했다.

홍은택 카카오 각자대표도 대국민 사과 기자회견에서 이중화 조치의 미흡함을 시인했다.


남궁훈(왼쪽)·홍은택 카카오 각자대표가 19일 경기 성남시 카카오판교아지트에서 대국민 사과를 하는 모습. 남궁훈 각자대표는 사퇴 의사를 밝혔다. 출처=사진공동취재단



홍 대표는 "주요 데이터와 서비스 응용프로그램 이중화 조치는 했으나 개발자들의 주요 운영 도구를 이중화하지 못해 복구가 지연됐다"며 "해당 조치는 판교 데이터센터가 정상화된 후 시작할 계획이다. 2개월 안에 유사 사고를 방지할 환경을 마련하겠다"고 말했다.

카카오는 경기 안산시에 내년 7월, 자체 데이터센터를 준공할 예정이지만, 그간 수차례 서비스 장애를 일으킨 탓에 이용자들은 여전히 우려를 제기한다.

정부는 방송통신발전 기본법을 개정해 카카오, 네이버 등 주요 온라인 서비스와 이들 업체의 데이터센터를 국가 재난관리 체계에 포함해 직접 관리하겠다는 계획을 밝혔다.

글 / IT동아 김동진(kdj@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 카카오 먹통에 무너진 일상…원인과 전망은?▶ 유료 이용률 정체, 만족도 하락...OTT 옥석은 ‘콘텐츠’와 '가격'이 가린다▶ [농업이 IT(잇)다] 카카오패밀리 “카카오·바닐라빈, 제주도를 상생과 기회의 섬으로”



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 인터넷 트랜드를 가장 빠르게 알고 있을 것 같은 스타는? 운영자 24/11/25 - -
1908 전기차 기계식 주차하려면…'이것' 꼭 확인해야 [3] IT동아갤로그로 이동합니다. 22.10.24 1217 2
1907 [주간투자동향] 인포플러스, 60억 원 규모의 시리즈A 투자 유치 IT동아갤로그로 이동합니다. 22.10.24 117 0
1906 [기고] 주목할 만한 미술가와 작품 세계 소개 - 국내 현대 미술 작가편 IT동아갤로그로 이동합니다. 22.10.24 103 0
1905 한층 복잡해진 아이패드 제품군, 주요 특징과 차이점은? [16] IT동아갤로그로 이동합니다. 22.10.23 4596 8
1904 [월간 자동차] 2022년 9월, 전월 대비 신차 등록은 늘고 중고차는 감소 IT동아갤로그로 이동합니다. 22.10.21 159 0
1903 [스케일업] 아시안푸드컨넥트 [2] “아날로그 무역 현장을 디지털 플랫폼으로 바꾼다는 것” IT동아갤로그로 이동합니다. 22.10.21 140 0
1902 [농업이 IT(잇)다] 리플라 “바이오 탱크로 플라스틱 재활용 새 시대 연다” IT동아갤로그로 이동합니다. 22.10.21 135 0
1901 에듀윌, 네이버클라우드로 '인공지능부터 사내 문화까지 고도화' IT동아갤로그로 이동합니다. 22.10.21 164 0
1900 실수, 고장으로 사라진 데이터, 어떻게 살리지? [3] IT동아갤로그로 이동합니다. 22.10.20 918 1
1899 [리뷰] 최적화 넘어 '혁신적 향상' 이뤘다, 13세대 인텔 코어 i9-13900K [81] IT동아갤로그로 이동합니다. 22.10.20 6897 18
1898 '광고 추가하고, 계정 공유는 유료화'…수익성 개선 힘쓰는 넷플릭스 [19] IT동아갤로그로 이동합니다. 22.10.20 3128 1
”제2의 카카오 먹통 사태 막아야”…해법은 철저한 ‘이중화’ IT동아갤로그로 이동합니다. 22.10.20 177 0
1896 에이치디에너지 “까쓰통·에코마인·에너지 플랫폼으로 ESG 견인” IT동아갤로그로 이동합니다. 22.10.20 141 0
1895 어도비, 카메라로 찍고 VR로 매만져 3D 콘텐츠 만드는 시대 선언 [6] IT동아갤로그로 이동합니다. 22.10.20 2468 4
1894 막 올린 2022 AIoT 국제전시회, 눈길 끈 부스는? [1] IT동아갤로그로 이동합니다. 22.10.19 183 0
1893 [리뷰] 드론의 시점에서 손 짓으로 비행하다, DJI 아바타 [7] IT동아갤로그로 이동합니다. 22.10.19 1360 2
1892 [IT애정남] 스마트폰을 통한 휴식, 정말 휴식이 맞을까요? [4] IT동아갤로그로 이동합니다. 22.10.19 1573 2
1891 [먹거리+IT] 버틀 이창언 대표 “채식주의자를 위한 소스를 개발하고 있습니다” IT동아갤로그로 이동합니다. 22.10.19 128 0
1890 [스타트업in과기대] 헌 신발로 지구를 살린다, 김승재연구소의 ‘새활용’ IT동아갤로그로 이동합니다. 22.10.19 197 0
1889 콘진원, 콘텐츠 업계 거장들의 인사이트 엿볼 자리 마련한다 IT동아갤로그로 이동합니다. 22.10.19 114 0
1888 [리뷰] 최신 기술 한껏 품은 워크스테이션 노트북, 델 프리시전 7670 [4] IT동아갤로그로 이동합니다. 22.10.19 1271 0
1887 AI 기술로 콘텐츠 도구 편의성 높인 어도비, 3D 분야까지 노린다 IT동아갤로그로 이동합니다. 22.10.19 153 0
1886 [리뷰] 한층 더 가다듬은 완성도와 활용도, 애플 아이폰 14 프로 [12] IT동아갤로그로 이동합니다. 22.10.18 1593 7
1885 카카오 먹통에 무너진 일상…원인과 전망은? [15] IT동아갤로그로 이동합니다. 22.10.18 1289 4
1884 부적절한 스마트폰 사용, 아이만의 문제일까? "부모가 변해야 하는 부분도 있어" IT동아갤로그로 이동합니다. 22.10.18 208 1
1883 [리뷰] 게이머를 위해 태어난 TV? 삼성 2022 Neo QLED 4K [16] IT동아갤로그로 이동합니다. 22.10.18 2905 6
1882 [스케일업] 프롬차일드 [2] 강재상 대표 “장점 앞세워 단백질 상품 마니아 모아라” IT동아갤로그로 이동합니다. 22.10.18 94 0
1881 소니·혼다 모빌리티, 日 전기차 구원투수 될까 IT동아갤로그로 이동합니다. 22.10.17 163 0
1880 서울산업진흥원, 오비맥주와 함께 스타트업 성장 지원 나서 IT동아갤로그로 이동합니다. 22.10.17 148 0
1879 [리뷰] 폴더블 노트북 시대를 펼치다, 에이수스 젠북 17 폴드 OLED [11] IT동아갤로그로 이동합니다. 22.10.17 1340 4
1878 '지포스 RTX 4080 12GB' 안 나온다…초유의 출시 번복, 이유는? [76] IT동아갤로그로 이동합니다. 22.10.17 6213 2
1877 [주간투자동향] 모놀리, 180 억 원 규모의 시드 투자 유치 IT동아갤로그로 이동합니다. 22.10.17 150 1
1876 [모빌리티 인사이트] 디지털 창문으로 새로운 모빌리티 경험을 만든다, 스마트 윈도우 IT동아갤로그로 이동합니다. 22.10.14 162 0
1875 [뉴스줌인] PWM과 ARGB 데이지체인 기능 더한 앱코 신형 쿨링 팬, 뭐가 다르지? IT동아갤로그로 이동합니다. 22.10.14 127 0
1874 [메이커X제조창업] ‘서울과학기술대학교의 제조 창업 세미나’에서 말하는 제조업 창업가의 사업 성공 전략 [3] IT동아갤로그로 이동합니다. 22.10.14 3081 0
1873 ‘글로브 박스, 도어트림?’...아리송한 자동차 실내 부위별 명칭 정리 IT동아갤로그로 이동합니다. 22.10.14 126 1
1872 [리뷰] 투톤 배색으로 완성도를 올리다, 카멜마운트 고든 GDA1 디자인 모니터 암 [14] IT동아갤로그로 이동합니다. 22.10.14 4047 0
1871 [농업이 IT(잇)다] 윌리스빌 “유산균으로 건강한 반려동물 문화 만든다 ” [2] IT동아갤로그로 이동합니다. 22.10.14 1250 0
1870 [스케일업] 푼타컴퍼니 [2] "브랜딩과 마케팅, 목적은 같습니다" [1] IT동아갤로그로 이동합니다. 22.10.14 1146 0
1869 아파트 망분리로 '월패드 해킹' 막는다...안정성과 가격 경쟁력 갖춘 보안 솔루션 필요 [2] IT동아갤로그로 이동합니다. 22.10.13 324 1
1868 [홍기훈의 ESG 금융] ESG와 채권 (5) 채권투자 포트폴리오에 ESG를 반영하는 6가지 방법 Part.1 IT동아갤로그로 이동합니다. 22.10.13 109 1
1867 'AI 화가' 품은 마이크로소프트, 연례행사서 신규 기능 대거 공개 IT동아갤로그로 이동합니다. 22.10.13 168 0
1866 걸어서 정류장 가면 최대 30% 할인…'알뜰교통카드' 신청·활용법 IT동아갤로그로 이동합니다. 22.10.13 185 0
1865 아빠와 사과밭 김재경 대표 “같은 사과? 꼭지와 포장재까지 차별화했다” IT동아갤로그로 이동합니다. 22.10.13 103 0
1864 32억화소 카메라 'LSST' 제임스 웹 망원경과 함께 우주 신비 푼다 [12] IT동아갤로그로 이동합니다. 22.10.13 2634 7
1863 삼성전자, 삼성 개발자 콘퍼런스 2022에서 '원 UI 5' 공개 [1] IT동아갤로그로 이동합니다. 22.10.13 255 0
1862 219만원 차세대 VR기기 공개한 '메타'…메타버스 올인 전략 이어간다 [41] IT동아갤로그로 이동합니다. 22.10.12 4326 3
1861 [IT하는법] 운전면허 갱신, 인터넷으로도 손쉽게 가능해 IT동아갤로그로 이동합니다. 22.10.12 220 0
1860 [고려대 스타트업 2022] 큐심플러스 “시뮬레이터, 암호통신으로 양자 시대 이끈다” IT동아갤로그로 이동합니다. 22.10.12 103 0
1859 [시승기] 쿠페와 SUV 매력을 동시에…’아우디 Q5 스포트백’ [3] IT동아갤로그로 이동합니다. 22.10.12 1331 0
뉴스 ‘전참시’ 2024 최고의 아이돌 투어스(TWS), 6인 6색 개성 가득 숙소 공개 디시트렌드 11.24
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2