4차산업혁명의 일꾼/Java&Spring웹개발과 서버 컴퓨터

장애대응 WIL

르무엘 2024. 1. 14. 16:03

- 문제 이번 주차를 지나며 겪었던 문제가 무엇이었나요? 
장애대응에 관해서... 성능향상에 관해서 너무 추상적이었다.
- 시도 문제를 해결하기 위해 어떤 시도를 하셨나요?
이것 저것 물어봤는데 그것보다 내실있게 TDD를 더 강화했고, 아티클을 봤다.
29CM 의 이굿위크 장애대응 기록. 이굿위크란? | by Greg Lee | Jan, 2024 | Medium

29CM 의 이굿위크 장애대응 기록

이굿위크란?

medium.com

 
- 해결 문제를 어떻게 해결하셨나요?
팀원들과 이야기하면서  장애대응과 성능향상을 위해서 AutoScaling, DB ScaleUP, redis 이야기가 나왔다.
멘토링 시간에 물어보니 AutoScaling 의 ScaleOut 과 DB ScaleUp은 모두 비용이 야기되니 배제하고
redis와 DB index를 이야기해 주셨다. 아이에 구조적으로 webflux로 비동기적이고 논블로킹 방식으로 많은 요청을 처리할수 있게 하는 방법도 이야기 해주셨다.
 
- 알게된 것 문제를 해결하기 위해 시도하며 새롭게 알게된 것은 무엇인가요?
성능측정시 2000개 까지는 오류가 없으나, 5000개를 traffic을 해보니 오류율이 5프로가 나왔다.
이 정도 traffic이 생길 것을 가정할 경우 redis, DB index를 쓰는 방법이 있고,
spring webflux로 구조를 바꾸는 방법이 그 다음에 있고
비용을 추가해서 해결하는 것은 최후의 해결책이다.
 
- 지난 목표 회고 지난 주에 설정해두었던 목표는 달성하셨나요? 잘된 것은 무엇이고 안된 것은 무엇인가요?
TDD는 비교적 이것저것 해보면서 알게 되었는데 TDD자체는 잘되나 전체 빌드에서 설정오류가 있는 부분을 발견했다.
해당 부분관련 공부를 조금더 해야겠다.
모니터링과 장애대응을 위해 트래픽 제어와 관리를 알게 되었다.
 
- 다음 목표 설정 반복적인 성장을 위한 실천 가능한 단기적인 목표를 설정해보세요!
redis및 DB index설정 후 성능 테스트 및 제어관리
 

LIST