Top-K Stream

Top-K 유지 기준

최소 힙의 루트는 현재 상위 K개에 들어오기 위한 경계값입니다. 새 값은 이 경계와 비교해서 남기거나 버립니다.

Exact

정확한 Top-K

순위 정확도가 중요하면 크기 K 힙을 유지하고 최종 출력 때만 정렬한다.

Window

구간별 스냅샷

시간 단위 통계가 필요하면 윈도우마다 힙 상태를 초기화하거나 분리한다.

Approx

지연 우선 처리

초대형 스트림에서는 정확도와 메모리 한계를 분리해 근사 전략을 검토한다.

1. K 고정상태 크기를 먼저 제한한다.
2. 경계 비교새 값이 루트보다 큰지 본다.
3. 교체경계를 넘는 값만 pop 후 push한다.
4. 출력 정렬필요한 순간에만 결과를 정렬한다.

`K`가 작고 입력이 길수록 `O(N log K)` 힙 방식의 이점이 커집니다. 동점 기준과 윈도우 초기화 정책은 구현 전에 고정해야 합니다.