DISTRIBUTED COST

RDB 스케일 아웃이 어려운 이유

관계형 기능 자체가 문제는 아니다. 여러 노드로 나뉘었을 때 조인과 트랜잭션의 조율 비용이 커지는 것이 핵심이다.

JoinTransactionPartition
분산 조인 필요한 행이 여러 노드에 흩어질 수 있음
분산 트랜잭션 커밋 합의와 장애 복구 비용 증가
전역 제약 유니크, FK, 정렬을 전역으로 맞추기 어려움
1 데이터 분할 샤드 키 선택
2 요청 라우팅 어느 노드가 처리할지 결정
3 결과 조합 필요하면 여러 노드 결과 병합