TUNING ORDER

커널 튜닝 절차

튜닝은 값을 크게 올리는 일이 아니라 병목 가설을 세우고 측정값으로 확인한 뒤 되돌릴 수 있는 단위로 변경하는 과정입니다.

연결 폭주

accept 대기열과 SYN 큐를 분리해서 본다

거부가 늘면 애플리케이션 처리량과 커널 큐 한계를 함께 확인합니다.

지표 ss -s
조정 somaxconn
포트 고갈

TIME_WAIT와 포트 범위

짧은 아웃바운드 연결이 많으면 재사용 정책과 포트 범위가 병목이 됩니다.

지표 ss -tan
조정 ip_local_port_range
메모리 압박

swap과 reclaim 점검

DB와 캐시 서버는 swap 진입 자체가 지연 시간 급등으로 이어질 수 있습니다.

지표 vmstat 1
조정 swappiness
쓰기 지연

dirty page 밀림

flush가 몰리면 평균은 좋아 보여도 p99 지연 시간이 튀기 쉽습니다.

지표 /proc/meminfo
조정 dirty_ratio
한 번에 하나만 변경 여러 값을 동시에 바꾸면 어떤 설정이 효과를 냈는지 알 수 없습니다.
기본값과 되돌림 기록 장애 시 원복할 수 있도록 현재 값, 변경 값, 적용 시간을 남깁니다.
p95와 p99 확인 평균 처리량보다 꼬리 지연 시간이 튜닝 부작용을 더 빨리 드러냅니다.