빈도 계산 계획

빈도 패턴은 키 정책이 먼저 결정한다

맵과 셋을 쓰는 문제는 count 로직보다 대소문자, 공백, 동점 처리 같은 키 계약에서 흔히 흔들립니다.

정규화

같은 의미를 같은 키로

집계 전에 대소문자, 공백, 특수문자 처리 규칙을 한 번만 적용합니다.

카운터

집계 상태 분리

등장 횟수, 마지막 위치, 원본 값을 분리해 저장하면 확장이 쉽습니다.

Top-K

동점 기준 고정

정렬 기준과 동점 기준을 고정한 뒤 heap 또는 sort를 선택합니다.

키 반례
키 설계 같은 의미의 입력이 같은 키로 들어오는지 반례를 만듭니다.
메모리 고유 키 수가 커질 때 압축이나 스트리밍 후보를 검토합니다.
출력 계약 빈도 동률, 원본 순서, 사전순을 명시해 결과 변동을 막습니다.