Full-text Index

문서 전체를 매번 훑지 않고,
단어별 문서 목록에서 바로 후보를 좁힙니다

전문 검색 인덱스는 문서를 저장할 때 단어를 분해해 두고, 검색 시에는 해당 단어의 문서 ID 목록만 읽어 빠르게 결과를 계산합니다.

이 다이어그램의 핵심

역인덱스의 중심은 단어입니다. 문서 → 단어별 목록으로 바꿔 두면 AND 검색은 교집합만 계산하면 됩니다.

1. 문서를 읽고 단어를 뽑음 입력
문서 1 데이터베이스 설계는 중요하다
문서 2 데이터베이스 인덱스 최적화
문서 3 인덱스 설계 가이드
2. 역인덱스가 단어별 문서 목록을 유지 중심 구조
역인덱스 항목 "데이터베이스" -> [문서1, 문서2]
역인덱스 항목 "설계" -> [문서1, 문서3]
역인덱스 항목 "인덱스" -> [문서2, 문서3]
3. 검색은 목록의 교집합 계산 결과
검색어 설계 AND 인덱스
가져온 목록 "설계" -> [문서1, 문서3] "인덱스" -> [문서2, 문서3]
AND 결과 [문서3]

두 단어를 모두 포함한 문서만 남습니다.

왜 빠른가? LIKE %검색어% 는 본문을 하나씩 검사하지만, 역인덱스는 이미 만들어 둔 문서 ID 목록만 비교합니다.