감지
오류율, latency, saturation 지표가 SLO 위반이나 이상 증가를 알려준다.
모니터링 시스템은 로그 저장소 하나가 아니라, metric으로 이상을 감지하고 trace로 구간을 좁히며 log로 사건 맥락을 확인하는 세 신호의 조합이다.
오류율, latency, saturation 지표가 SLO 위반이나 이상 증가를 알려준다.
trace가 gateway, service, DB, 외부 API 중 느린 span을 보여준다.
구조화 로그에서 user scope, route, error code, request id를 찾는다.
alert가 runbook, 담당자, 롤백 기준과 연결된다.