ops readiness
운영 준비는 관측, 방어, 확장을 한 흐름으로 묶는다
배포가 끝난 뒤에는 로그와 알림으로 상태를 보고, 보안 경계로 위험을 줄이며, 트래픽 증가에 맞춰 확장합니다.
Observe
Observe
로그, 메트릭, 오류 추적으로 장애가 어디에서 시작됐는지 확인합니다.
Protect
Protect
HTTPS, 방화벽, IAM, 시크릿 관리로 노출 범위를 줄입니다.
Recover
Recover
롤백과 알림 기준을 정해 장애 인지 후 복구 시간을 줄입니다.
Scale
Scale
로드 밸런싱, 캐싱, CDN, DB 복제로 병목 계층을 분산합니다.
운영 신호
응답 시간, 오류율, CPU, 메모리, DB 연결 수를 함께 봅니다.
보안 신호
비밀 값 노출, 과도한 권한, 미적용 보안 업데이트를 우선
점검합니다.
확장 신호
읽기 부하인지 정적 파일 부하인지에 따라 캐시와 복제 위치가
달라집니다.
운영 품질은 배포 자동화 이후에도 시스템 상태를 보고 막고 되돌리는 기준이 남아 있는지로 판단합니다.