triage

장애는 증상에서 확인 지점과 명령어 순서로 좁힌다

CPU, 메모리, 디스크, 네트워크 신호를 한 번에 보지 말고 증상별로 먼저 볼 지점을 정한다.

Symptom 느림/멈춤/오류 사용자 관찰
Signal CPU/mem/disk/net 첫 지표
Command top, df, ss 확인 도구
Decision 원인 좁힘 다음 조치
증상
먼저 볼 곳
다음 확인
느림
CPU/load
프로세스별 사용량
응답 없음
network/socket
포트/연결
공간 오류
disk/inode
로그/정리
핵심 장애 진단은 많은 명령어를 외우는 일이 아니라 증상마다 확인 순서를 짧게 잡는 일이다.