Distributed DB

분산 DB는 쓰기 기준점과 장애 중 읽기 정책부터 비교한다

제품 이름보다 중요한 것은 누가 쓰기를 조정하는지, 데이터가 어떻게 나뉘는지, 복제가 어떤 일관성 비용을 만드는지이다.

쓰기 기준점leader가 있는가, 여러 노드가 받는가?
분할 방식샤드 키, 파티션 키, 범위 중 무엇인가?
복제 기준합의, quorum, replica set의 역할은?
장애 중 읽기강한 읽기와 지연 허용 중 무엇을 택하는가?
제품 쓰기 기준점 분할/복제 장애 중 읽기 운영 질문
MongoDB Primary가 쓰기를 받는다. 샤드 키 + Replica Set read concern 설정에 좌우된다. chunk 이동과 primary 선출 시간을 관측하는가?
Cassandra 여러 노드가 쓰기를 받는다. 파티션 키 + quorum/repair consistency level로 타협한다. wide row와 tombstone 비용을 관리하는가?
Spanner 리더 그룹과 합의가 기준이다. 키 범위 + Paxos 계열 강한 읽기 가능 리전 간 지연을 감당할 수 있는가?
Redis Cluster slot 소유 노드가 기준이다. hash slot + replica failover 재시도 필요 slot 재배치와 재시도 로직을 준비했는가?

핵심: 분산 DB 비교는 기능표가 아니라 쓰기 조정자, 분할 키, 복제 정책, 장애 중 읽기 계약을 맞추는 일이다.