Vector DB

벡터 DB는 의미를 좌표로 저장하고 가까운 후보를 빠르게 찾는다

텍스트, 이미지, 문서 조각을 임베딩 벡터로 바꾼 뒤 유사도 검색을 수행합니다. RAG에서는 사용자의 질문과 의미가 가까운 문서 조각을 찾아 LLM에 근거 컨텍스트로 넘기는 역할을 합니다.

1 문서 분할

긴 문서를 검색 가능한 조각으로 나눈다.

2 임베딩 생성

각 조각을 의미를 담은 숫자 배열로 변환한다.

3 인덱싱

가까운 벡터를 찾기 쉬운 구조로 저장한다.

4 유사도 검색

질문 벡터와 가까운 후보를 순위로 가져온다.

5 RAG 연결

검색 결과를 모델 입력 컨텍스트로 붙인다.

Query embedding 질문도 같은 의미 공간의 벡터가 된다

"트랜잭션 격리 수준이 뭐야?"
[0.72, 0.41, 0.86, 0.58, ...]

0.72

0.41

0.86

Nearest neighbors 정확한 단어보다 의미가 가까운 조각을 고른다

ACID와 격리 수준

READ COMMITTED, SERIALIZABLE 설명

0.91

동시성 제어

락, MVCC, 충돌 처리

0.84

트랜잭션 로그

복구와 원자성 보장

0.73

강점 유사도 기반 후보 검색

키워드가 정확히 일치하지 않아도 의미가 가까운 문서나 상품을 찾는다.

설계 청크와 메타데이터가 품질을 좌우

문서를 어떻게 자르고, 날짜·권한·카테고리 필터를 어떻게 붙일지 결정해야 한다.

한계 정확한 집계와 트랜잭션은 별도 책임

벡터 검색은 후보를 찾고, 원장성 보장은 관계형 DB나 업무 시스템이 맡는다.