1️⃣ 멀티 AZ는 왜 “안정성”이냐

AZ가 뭔가

  • 같은 리전 안의 물리적으로 분리된 데이터센터
  • 전원, 네트워크, 랙 단위까지 분리

멀티 AZ의 목적

“하나의 데이터센터가 죽어도 서비스는 살아있게”

멀티 AZ가 막아주는 것

  • 서버 장애
  • 스토리지 장애
  • 랙 단위 장애
  • AZ 단위 정전

특징

  • 지연(latency) 거의 없음
  • 데이터 동기화 쉬움
  • 애플리케이션 수정 최소

👉 기본 내구성(Resilience)
👉 운영의 최소 조건

그래서 멀티 AZ는 선택이 아니라 기본값입니다.


2️⃣ 멀티 리전은 왜 “전략”이냐

리전이 뭔가

  • 국가/대륙 단위로 완전히 분리된 인프라
  • 네트워크, 제어 plane, 운영 주체까지 다름

멀티 리전의 목적

“비즈니스 리스크를 분산하는 것”

멀티 리전이 대응하는 리스크

  • 리전 전체 장애
  • 클라우드 사업자 대형 사고
  • 국가/정책 이슈
  • 재난/재해
  • 트래픽 지역 편중

특징

  • 지연(latency) 큼
  • 데이터 동기화 어려움
  • 비용 증가
  • 운영 복잡도 폭증

👉 기술 문제가 아니라 의사결정 문제


3️⃣ 그래서 이 문장이 정확한 이유

멀티 AZ

  • 안 하면 바로 장애
  • 안 하면 “설계 미흡”

멀티 리전

  • 안 해도 서비스는 운영 가능
  • 하지만 선택에 따라 회사의 생존 전략이 달라짐

👉 이 차이 때문에:

멀티 AZ = 엔지니어링 문제
멀티 리전 = 비즈니스 전략


4️⃣ 실무 예시로 보면 더 명확해짐

케이스 1: 공공 SI / 내부 서비스

  • 사용자 지역 한정
  • SLA 낮음
  • 예산 제한

👉 멀티 AZ까지만
멀티 리전은 과함


케이스 2: 금융 / 결제 / 전국 서비스

  • 중단 시 손실 큼
  • 신뢰도 중요

👉 멀티 AZ +
👉 DR 리전(콜드/웜) 전략


케이스 3: 글로벌 서비스

  • 지역별 사용자
  • 지연 민감

👉 액티브–액티브 멀티 리전
(이건 기술이 아니라 회사의 방향성)


5️⃣ 흔한 착각 정리

  • ❌ “멀티 AZ면 재해 복구 됐지?”
    → ❌ 리전 장애엔 무력
  • ❌ “멀티 리전이 더 좋으니까 무조건 해야지”
    → ❌ 비용/복잡도 감당 못 하면 독

6️⃣ 마무리

멀티 AZ는 시스템을 살리기 위한 기본이고,
멀티 리전은 비즈니스를 살리기 위한 선택이다.

LIST

+ Recent posts