backup objective
RPO는 잃어도 되는 데이터, RTO는 멈춰도 되는 시간이다
백업과 재해복구 목표는 두 축으로 나눠 읽는다. 어느 시점까지 복구할지와 얼마 안에 서비스를 살릴지가 다르다.
사고
장애, 랜섬웨어, 삭제, 재해로 서비스와 데이터가 영향을 받는다.
복구점
어느 백업 시점으로 돌아갈지 정한다.
복구시간
서비스를 몇 분 또는 몇 시간 안에 다시 제공할지 정한다.
RPO
Recovery Point Objective
복구 시점 목표다. 사고가 나도 최대 얼마만큼의 데이터 손실을 감수할 수 있는지 정한다.
예: RPO 1시간이면 최대 1시간치 데이터 손실을 감수한다.
RTO
Recovery Time Objective
복구 시간 목표다. 사고 후 서비스를 정상 수준으로 되돌리기까지 허용되는 시간을 정한다.
예: RTO 2시간이면 2시간 안에 서비스를 복구해야 한다.
관점
RPO가 낮을수록
RTO가 낮을수록
요구
백업 주기, 복제, 로그 보존이 촘촘해야 한다.
자동 전환, 대기 시스템, 복구 절차 자동화가 필요하다.
비용
저장소와 네트워크 복제 비용이 커진다.
이중화와 운영 인력, 훈련 비용이 커진다.
질문
얼마 전 데이터까지 잃어도 업무가 버티는가.
서비스 중단을 얼마나 오래 감당할 수 있는가.
업무 등급
핵심 결제, 인증, 고객 DB처럼 중단 비용이 큰 업무는 목표를 더 낮게 잡는다.
복구 테스트
목표만 정하고 끝내지 말고 실제 복구 시간이 목표 안에 들어오는지 검증한다.
비용 균형
목표를 낮출수록 비용이 커지므로 업무 중요도와 예산을 함께 본다.