실시간 통신 선택은 기능명이 아니라 운영 조건의 교차점이다
긴 연결은 실패 복구, 프록시 timeout, 느린 클라이언트, 토큰 갱신까지 포함해야 운영 가능한 선택이 된다.
질문
SSE 쪽으로 기움
WebSocket 쪽으로 기움
누가 주로 보내나
서버 이벤트가 대부분
클라이언트 입력도 잦음
재연결 복구
Last-Event-ID로 충분
sequence/ack/중복 제거가 필요
프록시 환경
HTTP streaming 허용
Upgrade와 idle timeout 제어 가능
느린 소비자
일부 이벤트 누락 허용
queue 상한, drop, backpressure 필수
운영 체크
봐야 하는 지표
나빠지는 신호
Auth
토큰 만료와 갱신률
긴 연결 중 인증 만료
Scale
연결 수, fanout, pub/sub 지연
서버별 상태 불일치
Observe
재연결률, heartbeat timeout
모바일/프록시 구간에서 끊김 증가