NestJS · 운영 전략

테스트·배포·운영을 하나의 릴리스 흐름으로 묶기

최종 운영 전략은 테스트 목록을 적는 것이 아니라, 변경 위험에 맞는 검증을 통과하고 배포 후 지표를 보며 필요하면 되돌리는 흐름을 만드는 것이다.

01

위험 분류

API 계약 변경, DB migration, 설정 변경, 단순 코드 수정을 위험도별로 나눈다.

02

검증 실행

위험도에 맞춰 단위, 통합, E2E, migration dry-run, smoke test를 조합한다.

03

점진 배포

health와 핵심 지표를 보며 canary나 blue-green으로 노출을 늘린다.

04

운영 대응

알림, runbook, 롤백 기준, 데이터 복구 절차를 문서화한다.

Migration
데이터 변경 backward compatible 단계와 rollback 가능성 확인
코드 배포 순서 중요
Smoke
배포 직후 확인 health, 로그인, 주요 API를 빠르게 검증
상세 테스트 대체 아님
Canary
점진 노출 일부 트래픽에서 오류율과 latency를 관찰
자동 롤백 기준 필요
Runbook
장애 절차 증상, 확인 쿼리, 완화, 복구, 연락 경로
훈련과 갱신 필요

게이트 · 관측 · 롤백 점검

게이트 테스트 통과뿐 아니라 migration과 smoke 결과가 배포 기준이다.
관측 배포 후 오류율과 p95 latency가 즉시 보인다.
롤백 코드와 데이터 변경을 되돌릴 수 있는 범위를 안다.
문서 운영자가 절차만 보고 대응할 수 있다.