1️⃣ 트래픽은 사건이고, 운영 시간은 비용이다
- 트래픽: 피크가 있어도 예측 가능
- 운영 시간: 매일 발생, 누적 비용
문제는 대부분 여기서 납니다.
- 장애 대응 회의
- 데이터 보정
- 재배포/핫픽스
- 운영자 문의 대응
👉 성능 20% 개선보다 운영 시간 50% 감소가 ROI가 큽니다.
2️⃣ 운영 시간을 줄이는 설계의 실체
① 되돌릴 수 있는 배포
- 기능 플래그 on/off
- 롤백이 버튼 하나
- 스키마 변경과 코드 변경 분리
효과:
- 야간 배포 감소
- “일단 배포해보자” 불필요
② 장애가 ‘사건’이 아니라 ‘절차’가 됨
- 플레이북
- 알람 임계치 명확
- 대응 주체 단일화
효과:
- 호출 횟수 감소
- 특정 인력 종속 제거
③ 데이터가 설명 가능하다
- 상태 전이 모델
- 이력 테이블
- 원본 보존
효과:
- “왜 이렇게 됐죠?” 대응 시간 급감
- 수동 보정 거의 사라짐
④ 외부 연동은 항상 실패한다고 가정
- 타임아웃
- 서킷 브레이커
- 수동 차단 스위치
효과:
- 외부 장애 = 우리 장애 ❌
- 운영자 개입 최소화
3️⃣ 트래픽 최적화 집착의 함정
현실에서 자주 보는 장면:
- 캐시 도입
- 비동기 전환
- 분산 처리
그런데:
- QPS 낮음
- 병목은 외부 API
- 운영 복잡도만 상승
👉 운영 시간 증가 = 성능 개선 실패입니다.
4️⃣ 좋은 백엔드의 판단 질문
다음 질문에 YES가 많을수록 좋은 백엔드입니다.
- 장애 나도 사람 안 깨우는가?
- 신규 인력이 와도 무서운 영역이 없는가?
- 배포가 일상 업무인가?
- 데이터 이슈를 말로 설명할 수 있는가?
성능 수치는 이 다음입니다.
5️⃣ 한 줄 기준
“이 시스템은 사람 시간을 얼마나 먹는가?”
적게 먹으면 좋은 백엔드
많이 먹으면 아무리 빨라도 나쁜 백엔드입니다
LIST
'Spring & Backend > Architecture' 카테고리의 다른 글
| 좋은 설계는 똑똑해 보이지 않고 안전해 보인다. (0) | 2026.02.04 |
|---|---|
| 설계는 정답을 고르는 게 아니라 변경 비용을 정하는 일이다 (1) | 2026.02.04 |
| 모놀리스는 죄가 아니다. 이유 없는 분산이 죄다 (0) | 2026.02.04 |
| 정보처리기술사의 전망 (1) | 2026.02.01 |
| 공공기관 SI 프로젝트 시스템 설계 방식 (0) | 2026.01.28 |
