알림은 고정 숫자보다 기준선 이탈을 본다
같은 80%도 평소 패턴에 따라 정상 배치일 수도, 장애 징후일 수도 있습니다. 알림은 숫자 하나가 아니라 평소 범위와 방향을 봅니다.
평소 범위
현재 관측값
Normal평소 변동 폭 안
Watch기준선보다 빠르게 상승
Page사용자 영향 또는 포화 지속
지표
평소 기준선
이탈 신호
첫 확인
CPU
배치 시간대는 높을 수 있음
비배치 시간 급상승 또는 포화 지속
최근 SQL·배포·배치 변경
Lock wait
짧은 대기는 정상
같은 blocker 반복, timeout 증가
blocking session과 SQL
Replication lag
일시적 지연은 허용
읽기 지연 증가, failover 위험
장기 트랜잭션과 apply 상태
Disk
완만한 증가
증가 속도 급변, 자동 확장 한계 접근
archive log, temp, 보관 정책
좋은 알림은 “몇 % 이상”보다 “평소보다 얼마나 빨리 벗어났고 사용자 영향이 있는가”를 먼저 묻습니다.