반응형
다음과 같은 Server - DB 아키텍처가 있다고 가정해보자.Source / Replica 구조의 Replication 통해 가용성과 읽기/쓰기 작업의 부하 분산을 확보했다.Replication에 대해 알아보고 싶다면 아래 포스팅을 참고하자.2024.11.09 - [◼ CS 기초 지식/[데이터베이스]] - [MySQL] DB 레플리케이션에 대해 알아보자. 하지만 데이터는 지속적으로 축적될 것이고 10억건의 데이터가 쌓였을 때도 문제가 없을까?인덱싱을 적절히 적용한다 하더라도 인덱스도 디스크 용량을 먹고 디스크 용량에도 제한이 있다.Scale Up에도 한계가 있는 것이다. 이 문제를 해결할 수 있는 파티셔닝과 샤딩에 대해 한번 알아보자.Partitioning (파티셔닝)테이블을 더 작은 테이블들로 쪼개는..
레디스를 캐시로 잘 활용하기 위해서는 어떤 캐싱 전략을 적절히 도입하느냐에 따라 다르다.이 적절히라는 말은 캐싱 전략을 데이터의 특성과 엑세스 패턴을 잘 고려해 적용하냐는 것이다.어떤 캐싱 전략들이 있는지 한 번 알아보고 자신의 목적에 맞는 캐싱 전략을 선택할 수 있도록 하자. Redis에 대해 알아보고 싶다면 아래 포스팅을 참고하자.2023.09.11 - [◼ CS 기초 지식/[데이터베이스]] - [Redis] 레디스란? 특징, 활용예시, 비교 정리읽기 전략 Look Aside 전략1. cache에서 원하는 cache 데이터가 있는지 조회 (Cache Hit)2. 없다면 DB에서 조회 (Cache Miss)3. DB에서 조회한 데이터를 cache에 업데이트 데이터를 반복적으로 읽는 작업이 많을 때 사용..
DB Replication(레플리케이션)이란?Replication이란 번역하면 ‘복제’라는 뜻으로 DB를 복제한다는 뜻이다.기준이 되는 서버를 Source(원본) 서버라 하고, Source 서버와 동일한 내용을 갖는 또 다른 서버를 Replica(복제본)라 한다.즉, DB를 복제해서 여러 대의 DB 서버에 저장하는 방식이다.위는 Replication 기본 형태로 Source는 쓰기 작업만, Replica는 읽기 작업만 수행하도록 구성한다.(이외에도 다양한 Replication 방식이 있는데 ‘MySQL Replication 구성 형태’ 목차에서 설명한다.) - 참고로 기존에는 Master/Slave라는 용어를 사용해왔지만 위키백과에서 다음과 같은 문제로 Source/Replica와 같은 용어가 채택되고 ..
왜 저장 순서와 다르게 조회가 되지..? (MySQL 시간 타입의 정밀도)현재 진행하고 있는 프로젝트에서 저장된 순서데로 조회가 되길 기대했던 기능이 있었다.저장된 순서는 아래의 createdAt 필드를 사용해 오름차순으로 구분했다.알림 1을 저장하고, 알림 2를 저장하면 createdAt 기준으로 조회시 [알림1, 알림2] 순서로 조회가 되야 하는데의도와 다르게 [알림2, 알림1]이 조회되고 있었다.뭐가 문제였을까 ? 기본적으로 나노초가 포함되어 시간이 저장될 것을 기대했지만 초까지만 저장되고 있었고저장된 순서는 나노초 단위로는 구분이 되더라도 초는 같아서 의도와 다르게 조회되고 있었던 것이다. 저장 순서데로 조회가 가능하도록 해보자MySQL의 공식문서를 살펴본 결과 시간 타입에 (fsp) 정밀도를 ..
B-Tree란?B-Tree란 RDBMS에서 가장 많이 사용되는 Self Balanced Tree (자가 균형 이진 검색 트리)로대량의 데이터를 효율적으로 저장하고 검색하기 위해 고안된 O(logN)의 시간 복잡도를 갖는 자료 구조이다. B-Tree는 이진 트리(Binary Search)에서 여러 가지 면에서 확장된 구조이다.이진 트리와 b-tree의 차이를 한번 가볍게 살펴보자. 이진 트리 vs B-Tree이진 트리각 노드는 최대 두 개의 자식(왼쪽, 오른쪽)을 가질 수 있다.B-Tree각 노드는 최대 m개의 자식을 가질 수 있으며, m은 B-Tree의 차수(각 노드가 지닌 가지의 수)이다.위 비교를 보면 B-Tree는 더 많은 자식을 가질 수 있는 것을 볼 수 있다.이는 곧 B-Tree가 노드당 하나..