Alert Baseline

알림은 고정 숫자보다 기준선 이탈을 본다

같은 80%도 평소 패턴에 따라 정상 배치일 수도, 장애 징후일 수도 있습니다. 알림은 숫자 하나가 아니라 평소 범위와 방향을 봅니다.

평소 범위 현재 관측값

Normal평소 변동 폭 안 Watch기준선보다 빠르게 상승 Page사용자 영향 또는 포화 지속

지표

평소 기준선

이탈 신호

첫 확인

CPU

배치 시간대는 높을 수 있음

비배치 시간 급상승 또는 포화 지속

최근 SQL·배포·배치 변경

Lock wait

짧은 대기는 정상

같은 blocker 반복, timeout 증가

blocking session과 SQL

Replication lag

일시적 지연은 허용

읽기 지연 증가, failover 위험

장기 트랜잭션과 apply 상태

Disk

완만한 증가

증가 속도 급변, 자동 확장 한계 접근

archive log, temp, 보관 정책

좋은 알림은 “몇 % 이상”보다 “평소보다 얼마나 빨리 벗어났고 사용자 영향이 있는가”를 먼저 묻습니다.