모니터링은 이상 신호를 찾고, 프로파일링은 원인 코드를 좁힌다

운영 성능 관리는 지표 수집에서 끝나지 않습니다. 알림, 원인 가설, 프로파일 캡처, 수정 배포, 재측정이 하나의 루프로 이어집니다.

1Metric

latency, throughput, error rate, CPU, memory, DB 지표를 계속 모읍니다.

2Alert

평소 패턴과 다른 변화를 알림으로 올립니다.

3Profile

CPU, event loop, memory, trace 중 필요한 도구로 코드 경로를 봅니다.

4Verify

변경 전후 p95, error rate, resource 사용량을 다시 비교합니다.

Monitoring

운영 중인 시스템의 건강 상태와 추세를 계속 봅니다.

Profiling

특정 병목의 함수, 콜스택, 메모리 객체를 깊게 봅니다.

연결점

모니터링 알림이 프로파일링 대상과 시간대를 정해 줍니다.

핵심: Monitoring은 어디가 아픈지, Profiling은 어느 코드가 아픈지 찾는다.