CPU run queue, I/O await, 메모리 pressure를 먼저 잡아 병목 후보를 줄입니다.
모니터링 증거 수집 사다리
성능 문제는 단일 명령 결과보다 시간대, 프로세스, 커널 로그, 호출 지점을 맞춰 볼 때 원인이 좁혀집니다.
01부하 관찰
02/proc 대조
03커널 로그
04호출 추적
05프로파일링
status, fd, maps, limits는 프로세스가 실제로 가진 파일, 메모리, 제한값을 보여 줍니다.
OOM, 장치 reset, unit 실패처럼 커널과 systemd가 남긴 사건 순서를 확인합니다.
시스템 호출 대기, hot path, 크래시 시점의 스택을 분리해 재현 가능한 설명으로 만듭니다.