재해 복구 목표

장애 시점 하나를 기준으로 왼쪽은 RPO, 오른쪽은 RTO를 읽습니다

RPO는 어디까지의 데이터를 살릴 수 있는가, RTO는 서비스를 얼마나 빨리 다시 여는가를 뜻합니다. 둘 다 시간 목표지만 재는 방향이 다릅니다.

RPO 5분 예시
장애가 14:30에 났다면 14:25 상태까지 복구 가능. 최근 5분 변경분은 잃을 수 있습니다.
복구 가능한 최신 시점
14:25
백업 + 아카이브 로그 확보
이 지점까지의 데이터는 되살릴 수 있습니다.
공통 기준점
14:30
장애 발생
RPO와 RTO를 모두 이 시점에서 측정합니다.
복구 진행
+2분
복원·로그 적용·전환
준비된 절차와 대기 서버가 있으면 중단 시간을 줄일 수 있습니다.
서비스 재개
14:34
사용자 요청 재개
정상 응답이 다시 시작되면 이 시점이 RTO의 끝입니다.
RTO 4분 예시
장애 후 14:34에 서비스가 돌아오면 중단 시간은 4분입니다. 복구 절차를 자동화할수록 더 짧아집니다.
RPO를 줄이려면 백업 주기를 짧게 하고, 운영 환경에서는 아카이브 로그나 실시간 복제를 준비해야 합니다.
RTO를 줄이려면 복구 절차를 문서화하고, 정기적으로 복구 테스트를 해 두며, 필요하면 대기 서버와 자동 전환을 둡니다.
한 줄 결론

RPO는 장애 직전 얼마나 잃을 수 있는지, RTO는 장애 후 얼마나 멈춰 있어도 되는지입니다. 목표를 더 짧게 잡을수록 운영 준비와 비용이 함께 커집니다.