Hash Join의 핵심은 전체 비교를 버킷 조회로 바꾸는 것입니다. 동등 조인에서는 이 한 번의 구조화가 이후 탐색 비용을 크게 줄입니다.
메모리에 올리기 쉬운 쪽을 먼저 잡고 조인 키를 읽습니다.
Probe 단계에서는 전체를 다시 보지 않고, 해당 버킷 후보만 검사합니다.
각 행마다 해시를 계산하고 같은 버킷에서만 매칭을 찾습니다.
비용 감각은 O(N + M)에 가깝습니다. 그래서 대량 데이터의 = 조인에서 Nested Loop Join보다 유리해지기 쉽습니다.