세션 111 상세
세션 정보
1015 장애 원인 분석- 소속
- grepp
- 유형
- 키노트
세션 영상
세션 상세 설명
#ESG #사회적책임 #개발문화 #시스템구성 #아키텍처 #업무시스템 #서비스장애 #이상탐지2022년 10월 15일, 판교 데이터센터 화재로 인해 카카오 서비스 전반에 장애가 발생했습니다. 카카오는 최대한 빠르게 장애를 복구하기 위해 노력했으나, 모든 서비스의 복구가 완료된 것은 2022년 10월 20일이었습니다. 이후 카카오는 객관적인 조사와 분석을 위해 외부 전문가인 grepp 이확영 대표를 비상대책위원회 원인조사 소위에 선임하고, 장애 복구가 지연된 원인을 면밀히 확인했습니다. 그리고 무엇이 부족했는지 알아낼 수 있었습니다. 본 세션에서는 당시 장애 대응이 더 빠르게 이뤄질 수 없었던 원인을 공개합니다. 앞으로 같은 장애가 되풀이되지 않도록 대책을 강구함과 동시에, if kakao 2022에서 사례를 공유해 다른 이들에게 도움이 되고자 합니다.
- 이확영
카카오 원인조사 소위원회 위원장을 맡고 있는 이확영입니다.