TCP 운영 점검

TCP 실무 튜닝 기준

Nagle, 지연 ACK, Keep-Alive, Fast Open은 모두 성능과 안정성의 균형을 바꿉니다. 값 하나를 켜기보다 서비스 패턴과 중간 장비를 함께 봐야 합니다.

Nagle와 ACK

작은 쓰기를 모으는 Nagle과 ACK를 늦추는 지연 ACK가 만나면 짧은 RPC에서 눈에 띄는 지연이 생길 수 있습니다.

Keep-Alive

조용히 끊긴 반개방 연결을 probe로 감지합니다. LB나 NAT idle timeout과 값이 맞지 않으면 효과가 줄어듭니다.

Fast Open

재연결 시 SYN에 데이터를 실어 1 RTT를 줄일 수 있지만 중복 실행 가능성과 중간 장비 호환성을 봐야 합니다.

운영 증상

TIME_WAIT, CLOSE_WAIT, SYN_RECV, retransmit 증가는 각각 다른 원인과 조치가 필요합니다.

Timeout split

connect, read, write, idle timeout을 구분해 로그와 알림을 만듭니다.

Backlog

accept queue와 SYN backlog 포화는 애플리케이션 처리 속도와 공격 신호를 함께 드러냅니다.

Retransmit

재전송 증가는 손실, 혼잡, 무선 품질, 터널 MTU 문제를 의심하게 합니다.