복구 시간 단축의 기준점

체크포인트는 다시 읽을 시작점을 뒤로 옮깁니다.

장애가 나면 모든 로그를 처음부터 보는 것이 아니라, 마지막 체크포인트 뒤에서부터 필요한 Redo만 수행합니다. 그래서 복구 시간은 짧아지고, 운영 중에는 체크포인트 I/O 비용을 함께 조절해야 합니다.

간격을 어떻게 잡느냐가 운영 트레이드오프입니다.
짧게
길게

짧은 간격은 장애 후 복구를 빠르게 하지만, 체크포인트를 더 자주 만들기 때문에 디스크 I/O 부담이 늘어납니다.

공유 로그 시간축
로그 시작 같은 로그 이력 장애
운영 중 체크포인트 생성

Dirty Pages를 디스크에 반영하며, 이후 복구가 건너뛸 수 있는 기준점을 남깁니다.

CP1
CP2
CP3
마지막 기준점
장애 후 복구, 체크포인트 없음

Redo가 로그 처음부터 장애 직전까지 이어져 가장 긴 복구 구간이 됩니다.

처음부터 전부 Redo
장애 후 복구, 체크포인트 있음

마지막 체크포인트 이후 로그만 다시 적용하므로 복구 시간이 짧아집니다.

CP3 이후만 Redo
무엇이 실제로 줄어드나?

체크포인트는 로그 자체를 없애는 기능이 아니라, Redo가 다시 읽어야 하는 범위를 줄여 복구 시간을 단축합니다.

운영 관점의 의미

체크포인트를 너무 드물게 잡으면 장애 후 오래 복구하고, 너무 자주 잡으면 정상 운영 중 디스크 쓰기 부담이 커집니다.