pile·
인프라 / DevOps·요기요요기요·

요기요 카오스 엔지니어링 (2) — 카오스 실험 결과 정리하기

문제24시간 운영되는 멤버십과 외부 연동 시스템에서 장애 상황의 대응 능력을 사전에 검증할 방법이 필요했다.
접근Stage 환경에 Locust로 약 350 RPS의 운영급 트래픽을 만들고 AWS FIS와 NACL로 Pod 네트워크 지연을 주입하면서 인프라 지표·애플리케이션 로그·Istio 게이트웨이를 함께 모니터링했다.
결과500ms 지연 시 RPS가 0까지 떨어지고 응답 시간이 30초로 늘어 한계를 확인했고, Redisson 예외 처리 보강·구독자 주문 비동기 개선·Redis Queue 최적화 같은 구체적 개선 과제가 도출됐다.
요기요
요기요 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. 인프라 / DevOps·vercel-blogVercel Blog·

    Vercel CLI 드라이런 배포로 실제 배포 전 구성 미리 확인하기

    Vercel CLI v54.17.2부터 vercel deploy --dry 명령으로 실제 파일 업로드 없이 배포 구성을 미리 검사할 수 있다. 프레임워크 감지 결과, 포함/제외 파일 목록, 디렉터리 크기 분포, 콘텐츠 해시까지 사전에 확인하고 나서 배포를 결정할 수 있어 의도치 않은 배포 실패를 예방한다.

    #deployment#ci-cd#vercel-cli+1