NestJS ch9-4 / monitoring loop

모니터링은 이상 신호를 찾고, 프로파일링은 원인 코드를 좁힙니다

운영 성능 관리는 지표 수집에서 끝나지 않습니다. 알림, 원인 가설, 프로파일 캡처, 수정 배포, 재측정이 하나의 루프로 이어집니다.

Metric

지표 수집

latency, throughput, error rate, CPU, memory, DB 지표를 계속 모읍니다.

->
Alert

이상 감지

임계값이나 평소 패턴과 다른 변화를 알림으로 올립니다.

->
Profile

원인 좁히기

CPU, event loop, memory, trace 중 필요한 도구로 코드 경로를 봅니다.

->
Verify

수정 후 재측정

변경 전후 p95, error rate, resource 사용량을 다시 비교합니다.

두 활동의 차이

혼동 방지
모니터링운영 중인 시스템의 건강 상태와 추세를 계속 봅니다.Prometheus, Grafana, APM
프로파일링특정 병목의 함수, 콜스택, 메모리 객체를 깊게 봅니다.Inspector, clinic, heap snapshot
연결점모니터링 알림이 프로파일링 대상과 시간대를 정해 줍니다.재현 가능한 부하와 함께 수행