네트워크 장애 진단

연결 문제 진단 순서

네트워크 명령어는 한 번에 모두 쓰기보다 실패 지점에 맞춰 선택합니다. 서버가 듣는지, 경로가 닿는지, DNS가 맞는지, 실제 패킷이 흐르는지 순서대로 봅니다.

01 서버가 포트를 열었나

리스닝 포트와 소유 프로세스를 먼저 확인합니다.

ss -tlnp
02 목적지까지 길이 있나

IP, 라우팅, 홉 지연을 나눠서 봅니다.

ip route, mtr
03 이름이 올바르게 풀리나

DNS 응답과 실제 접속 대상 IP를 대조합니다.

dig, nslookup
04 패킷과 HTTP 응답은 어떤가

방화벽, TLS, 애플리케이션 응답 시간을 분리합니다.

tcpdump, curl
TIME_WAIT 연결 상태 숫자는 증상보다 먼저 보는 지표입니다

`ss -s`에서 TIME_WAIT이 과도하면 짧은 연결이 반복되고 있다는 뜻입니다. 커넥션 풀, keep-alive, 클라이언트 재시도 정책을 함께 확인합니다.

포트 닫힘 서비스 미기동, 잘못된 바인딩, 방화벽 규칙을 봅니다.
DNS 불일치 캐시, 레코드, 내부 DNS 뷰 차이를 확인합니다.
응답 지연 네트워크 왕복 시간과 애플리케이션 처리 시간을 분리합니다.