KBO 리그 이닝 교체 때 광고 요청 견뎌내기
KBO 라이브 방송 이닝 교체 시 모든 시청자가 동시에 광고를 요청해 SSAI 서버 병목이 발생했다.
KBO 라이브 방송 이닝 교체 시 모든 시청자가 동시에 광고를 요청해 SSAI 서버 병목이 발생했다.
GitBook이 30,000개 문서 사이트를 운영하며 월 1.2억 페이지뷰를 처리하는 멀티테넌트 캐싱 아키텍처를 공개했다. Next.js의 use cache 지시문과 태그 기반 선택적 무효화로 일일 40,000건의 캐시 무효화를 300ms 이하로 처리하고, 2025년 5배 급증한 AI 트래픽(전체의 41%)도 흡수하고 있다.
채널톡 메인 백엔드 서버의 CI 가 36.6 분 걸려 개발 피드백 사이클이 느려졌다.
Vercel 팀이 Sandbox 파일시스템 스냅샷 복구 성능 문제를 해결하는 과정을 다룬다. 초기 구현은 안정성 우선으로 순차 처리였고 p75 복구 시간이 40초를 넘겼다. 병렬화와 NVMe LRU 캐시를 단계적으로 적용해 최종적으로 p75 서브-초(sub-second), p95 10초 미만을 달성했다.
Vercel이 배포 속도를 평균 400~600ms 줄인 함수 캐싱 개선을 자동 적용하기 시작했다. 핵심은 배포별 고유 환경변수(`VERCEL_DEPLOYMENT_ID` 등)가 함수 페이로드에 포함돼 코드가 같아도 매번 다른 해시가 만들어지던 문제를 해결한 것이다. 이 변수들을 런타임 주입으로 바꿔 코드가 동일하면 업로드 단계 자체를 건너뛴다.
Python 2.7 레거시 서버의 CI-Test 파이프라인이 약 13분 소요돼 긴급 배포 시 병목이 됐다. 실제 테스트는 2분이지만 패키지 설치·빌드 오버헤드가 11분을 차지했다.
Vercel이 2024년 Black Friday-Cyber Monday 96시간 동안 867억 건의 요청과 초당 194만 건의 피크 트래픽을 처리한 인프라 운영기를 공개했다. 엣지 렌더링·요청 collapsing·백그라운드 재검증 세 가지 기법을 조합해 원점 서버를 보호했고, DDoS 방어와 실시간 가시성을 통해 배포 속도를 유지했다.
ISR 캐시 만료 시 다수 요청이 동시에 함수를 호출해 원점을 과부하시키는 cache stampede 문제를 Vercel CDN이 리전당 단일 함수 호출로 해결하는 내부 아키텍처를 공개했다. 노드 레벨 + 리전 레벨 2계층 분산 락과 이중 확인 locking 패턴으로 동시성을 제어하며, 현재 하루 300만 건 이상의 요청을 자동으로 collapse 하고 있다.
Vercel이 함수, 라우팅 미들웨어, 빌드 사이에서 데이터를 공유하는 Runtime Cache API를 공개했다. 동일 리전 내 ephemeral 캐시로, getCache() API와 TTL·태그 기반 무효화를 지원한다.
@CircuitBreaker + @Cacheable 이중 어노테이션의 복잡성과 Cache Stampede(캐시 만료 시 DB 동시 요청 폭주) 문제로 API 응답이 급격히 지연됐다.
구독 설정 데이터가 하루 6000만 건 이상 조회되면서 RDB 쿼리가 1500 TPS를 넘나들었고, Caffeine 로컬 캐시(데이터 불일치)와 Redis 글로벌 캐시(CPU 70% 과부하) 모두 실패했다.
Redis 실무에서 TTL 미설정으로 인한 OOM, Big Key로 인한 성능 저하, Hot Key 만료 시 DB 폭주 등 운영 장애가 반복적으로 발생한다.
토니모리 공식몰은 프로모션 때마다 트래픽이 몰리면서 DB에 부하가 쏠려 응답이 지연됐고, 카테고리·배너·인기 상품처럼 거의 바뀌지 않는 데이터까지 매번 DB에서 조회되는 비효율이 있었다.
분산 환경에서 자주 접근하는 메타데이터를 효율적으로 조회하면서 데이터 일관성 유지.
AWS CodePipeline 기반 빌드가 소스 푸시 이후 배포까지 8분 이상 소요되며 외부 저장소에서 매번 의존성을 다운로드하는 비용이 높음.
Vercel이 자사의 Black Friday-Cyber Monday(BFCM) 실시간 대시보드를 어떻게 구축했는지 설명한다. 테라바이트 단위 데이터를 실시간으로 처리하면서도 수많은 방문자에게 부드러운 UI를 제공하는 게 핵심 과제였고, Next.js ISR + KV 캐싱 + 클라이언트 사이드 숫자 애니메이션으로 해결했다.
선물하기 서비스에서 실시간 DB 호출로 트래픽 급증 시 성능 저하가 발생했고, 일일 배치 기반 상품 정보가 실시간으로 반영되지 않았다.
Next.js Conf 2024에서 발표된 주요 기술 변경 사항을 정리한다. Next.js 15에서 GET Route Handler와 Client Router Cache의 캐싱 기본값이 uncached-by-default로 전환됐고, 개발 서버용 Turbopack이 공식적으로 stable 상태가 됐다. 주 7백만 다운로드로 가장 인기 있는 프론트엔드 프레임워크 지위를 유지하고 있다.
Incremental Static Regeneration(ISR)은 정적 생성의 성능과 동적 콘텐츠의 신선도를 동시에 달성하는 캐싱 전략이다. time-based/on-demand/tag-based 세 가지 전략과 Next.js·SvelteKit·Nuxt·Astro·Remix의 프레임워크별 구현 방식을 비교하고, 실제 사례를 통해 각 트레이드오프를 구체적으로 설명한다.
출고준수율(배송 일정 준수 비율) 계산이 복잡하고 초기 응답시간이 최대 5초에 달해 운영 불가 수준이었다.