대용량 트래픽을 견디는 서버 만들기 — Rust 기반 게이트웨이 구축

문제Node.js 기반 Apollo Gateway가 트래픽 급증 시 싱글스레드 이벤트 루프 블로킹으로 CPU·메모리 100% 도달 → 전 서비스 다운.

접근멀티스레드 처리를 위해 Apollo Router(Rust)로 전환. Redis DashMap으로 블랙리스트 O(1) 조회, Elasticsearch 로깅에 tokio 비동기 처리 적용, Rhai 스크립트로 쿠키·헤더·사용자 컨텍스트 전파. ALB weight 기반 카나리 배포로 안전하게 전환.

결과CPU 70%→15%(79% 감소), 메모리 40%→8%(80% 감소). P70/P90 응답시간 50% 단축, P95 100ms 이상 개선. 2025년 1월 이후 게이트웨이 크래시 0건.