세션 112 상세
세션 정보
달라지는 카카오 1) 재발방지를 위한 기술적 개선- 소속
- 카카오
- 유형
- 키노트
세션 영상
세션 상세 설명
#ESG #사회적책임 #시스템구성 #아키텍처 #업무시스템 #서비스장애 #이상탐지 #일이되게하는방식 #자동화 #infrastructure지난 10월 15일의 판교 데이터센터 화재로 카카오톡을 비롯한 카카오의 많은 서비스에서 대규모 장애가 발생했습니다. 데이터센터 이중화, 데이터와 서비스 이중화, 플랫폼과 운영 도구 이중화 등 시스템 전체 레이어에 걸쳐 철저한 이중화 구성이 되어 있었다면 장애의 영향이 적었을 것이고 장애로부터 서비스를 어렵지 않게 복구할 수 있었을 것입니다. 카카오는 앞으로, 이번 장애와 장애로부터 서비스를 복구하면서 배운 교훈을 발판삼아, 인프라 하드웨어 설비부터 서비스 애플리케이션에 이르기까지 전체 시스템 레이어에서 더욱 철저하게 대비책을 마련하고 실행하겠습니다. 이번 발표에서는 서비스 복구에서 겪은 어려움과 서비스를 복구하는 과정에서 배운 점, 그리고 재발 방지를 위해 앞으로 해야 할 일에 대해 이야기합니다.
- ean.lee
카카오 재발방지대책 소위원회 부위원장을 맡고 있는 이채영, Ean입니다.