CPU 사용률과 run queue로 계산 대기인지 스레드 폭증인지 먼저 본다.
성능 관찰 지표 연결
성능 진단은 CPU, 메모리, 디스크를 따로 보지 않습니다. run queue, major fault, iowait가 동시에 움직이는지 봐야 원인이 좁혀집니다.
01top / ps
02vmstat
03iostat
04trace
free memory보다 si/so, major fault, context switch 변화가 압박 신호다.
util, await, queue depth가 높으면 디스크 대기 때문에 CPU가 놀 수 있다.
strace/perf는 system call 반복과 hot path를 확인하는 마지막 확대경이다.
관찰 지표는 하나만 보면 오해하기 쉽습니다. CPU가 낮아도 iowait가 높으면 병목은 계산이 아니라 I/O 대기일 수 있습니다.