DISTRIBUTED COST
RDB 스케일 아웃이 어려운 이유
관계형 기능 자체가 문제는 아니다. 여러 노드로 나뉘었을 때 조인과 트랜잭션의 조율 비용이 커지는 것이 핵심이다.
Join
Transaction
Partition
분산 조인
필요한 행이 여러 노드에 흩어질 수 있음
분산 트랜잭션
커밋 합의와 장애 복구 비용 증가
전역 제약
유니크, FK, 정렬을 전역으로 맞추기 어려움
1
데이터 분할
샤드 키 선택
2
요청 라우팅
어느 노드가 처리할지 결정
3
결과 조합
필요하면 여러 노드 결과 병합