Overclocking dbt: Discord's Custom Solution in Processing Petabytes of Data

문제Discord 데이터 팀은 100명이 넘는 개발자가 2,500개 이상의 dbt 모델을 동시에 작업하면서 컴파일 시간 20분, 테스트 테이블 충돌, 페타바이트 리프레시 비효율 같은 한계에 부딪혔다.

접근`generate_alias_name` 매크로로 개발자별 테이블 네이밍을 자동 분리하고, `is_incremental()` 대신 시간 기반 처리와 BigQuery 파티션 복사를 도입했다. 시맨틱 버저닝으로 백필 범위를 정밀 제어한다.

결과모델 빌드 속도가 5배 빨라지고 컴파일 시간이 수 초로 단축됐다. 프로덕션 장애가 줄고 저장·처리 비용도 함께 감소했다.