pile·
인프라 / DevOps·github-engGitHub Engineering·

보호 장치가 목적을 잃었을 때 — 대규모 방어 시스템 운영의 교훈

문제GitHub의 과거 사고 대응용 보호 규칙이 오래 남아 정상 사용자의 낮은 요청량까지 429로 차단하는 false positive를 만들었다.
접근사용자 제보 시점부터 Edge, Application, 보호 규칙 로그를 상관 분석하고, 현재 차단 효과와 원래 목적을 비교해 낡은 규칙을 제거했다.
결과false positive는 전체 트래픽의 약 0.003~0.004%였지만 실제 사용자를 막았다. 임시 완화책은 만료일, 사후 리뷰, 관측성을 갖춰야 한다는 교훈을 남겼다.
github-eng
GitHub Engineering 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. 인프라 / DevOps·vercel-blogVercel Blog·

    Vercel CLI 드라이런 배포로 실제 배포 전 구성 미리 확인하기

    Vercel CLI v54.17.2부터 vercel deploy --dry 명령으로 실제 파일 업로드 없이 배포 구성을 미리 검사할 수 있다. 프레임워크 감지 결과, 포함/제외 파일 목록, 디렉터리 크기 분포, 콘텐츠 해시까지 사전에 확인하고 나서 배포를 결정할 수 있어 의도치 않은 배포 실패를 예방한다.

    #deployment#ci-cd#vercel-cli+1