State로컬 상태 제거
- 세션은 Redis나 DB로 이동
- 파일은 object storage로 이동
- 인메모리 카운터는 공유 저장소로 이동
Health트래픽 제외 기준
- readiness 실패 시 새 요청 차단
- liveness 실패 시 재시작
- 의존성 체크 깊이와 주기 조절
Pool하위 병목 계산
- DB pool 총량 재계산
- queue consumer 중복 처리 방지
- 외부 API quota와 timeout 점검
운영 리허설
배포 전 직접 확인한 대 종료로드 밸런서가 실패 인스턴스로 새 요청을 보내지 않는지 확인합니다.failover 로그 확인부하 증가replica 증가 후 p95 latency와 error rate가 실제로 낮아지는지 봅니다.전후 지표 비교DB 압박connection wait가 늘면 앱이 아니라 DB가 새 병목입니다.pool과 쿼리 최적화로 전환