Monitoring Stack

외부 모니터링은 수집에서 대응 기록까지 이어져야 한다

대시보드는 모든 지표를 한 화면에 넣는 것이 아니라 증상별 탐색 경로를 제공해야 한다.

1CollectDB exporter, agent, cloud metric을 수집한다.
2Store시계열 저장소에 기준선과 변화율을 남긴다.
3Visualize사용자 지연, DB 대기, 문제 SQL 화면을 분리한다.
4Alert업무 시간대와 배치 시간을 고려해 알림을 튜닝한다.
5Record조치와 원인을 incident note로 남겨 다음 기준선에 반영한다.