pile·
AI / ML·spotify-engSpotify Engineering·

코딩은 더 이상 제약이 아니다: Spotify에서 팀과 AI 에이전트까지 개발자 경험 확장하기

Spotify가 AI 코딩 도구를 조직 전반에 확산하며 얻은 결론은 "코딩은 더 이상 병목이 아니고, 이제 무엇을 만들지 결정하는 일이 새 병목"이라는 것이다. 프로덕션 코드베이스가 엔지니어 수보다 7배 빠르게 커지며 폭증한 유지보수 부담을, 배경 코딩 에이전트 Honk와 자동화 파이프라인으로 흡수한 과정을 다룬다.

핵심 포인트
  • 엔지니어들이 기능 개발보다 의존성 업그레이드, API 마이그레이션, 취약점 패치 같은 유지보수에 더 많은 시간을 썼고 마이그레이션이 불만 1순위였다.
  • 기존 Fleetshift로 250만 건 이상의 유지보수 PR을 대부분 무개입 자동 병합했지만, 결정론적 스크립트는 복잡한 리팩터링에서 한계에 부딪혔다.
  • Anthropic Claude Agent SDK 기반 배경 에이전트 Honk를 Kubernetes pod에서 다중 세션으로 돌리고 Slack에서 직접 호출하게 했다.
  • 엔지니어의 99%가 주간 AI 코딩 도구를 쓰고 94%가 생산성 향상을 보고했으며 PR 수는 76% 늘었다.
  • 과거 수주에서 수개월 걸리던 Java 마이그레이션을 엔지니어 한 명이 3일 만에 끝냈다.
상세 정리
  • 배경: 코드베이스가 인력보다 7배 빠르게 성장해 유지보수가 개발 시간을 잠식했고 특히 마이그레이션이 개발자 불만 1위로 지목됐다.
  • 1차 자동화: Fleetshift로 수천 개 컴포넌트에 걸친 변경을 오케스트레이션해 250만 건 넘는 PR을 자동 병합, 단순 반복 변경은 사람 손 없이 처리했다.
  • 한계 발견: API 호출 교체나 사용 패턴 리팩터링처럼 판단이 필요한 변경은 결정론적 스크립트로 모든 엣지 케이스를 못 잡았다.
  • Honk 구조: Claude Agent SDK로 만든 배경 에이전트를 K8s pod에 배포해 다중 세션을 스케줄링하고, CI에서 여러 OS 빌드로 변경을 스스로 검증하게 했다.
  • 분업: 엔지니어가 Slack 대화에서 Honk를 호출하면 Fleetshift가 타깃 식별과 스케줄링과 진행 추적을, Honk가 실제 코드 수정을 맡는다.
  • 컨텍스트 공급: Backstage 컴포넌트 카탈로그를 MCP와 CLI로 노출해 소유자 조회, 문서 열람, 담당 팀 Slack 알림을 에이전트가 수행하게 했다.
  • 표준화 루프: Golden State가 컴포넌트별 권장 기술을 정의하고 Soundcheck가 정적 분석·린팅과 결합해, 에이전트가 비표준 패턴을 쓰면 즉시 피드백하고 자동 교정한다.
  • 채택 곡선: Opus 4.5 출시 후 Claude Code 사용이 급증했다.
  • 새 병목: 코딩 병목은 풀렸지만 PR이 76% 늘며 리뷰 부담이 새 병목이 됐고, 자동 병합해도 되는 변경과 사람이 봐야 하는 변경을 가르는 판단이 중요해졌다.
  • 성능 관찰: 에이전트는 일관된 코드가 많을수록 성능이 오르고 파편화된 코드베이스에서는 측정 가능하게 성능이 떨어진다.
  • 향후: Honk v2는 공유 에이전트 세션과 팀 프로젝트, Chirp를 통한 에이전트 오케스트레이션 같은 멀티플레이어 협업으로 확장한다.
왜 읽나대규모 코드베이스의 유지보수·마이그레이션을 AI 에이전트로 자동화하려는 플랫폼·개발생산성 엔지니어에게 실제 도입 구조와 병목 이동 사례를 준다.
spotify-eng
Spotify Engineering 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. AI / ML·인프랩 (인프런)인프런 (인프랩)·

    학습 에이전트 — AI 두뇌 구축하기

    인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.

    #ai-agent#llm#llm-as-a-judge+2
  2. AI / ML·네이버 D2네이버 D2·

    AI 에이전트 회사 차리기: 설립부터 어디서든 동기화까지

    네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.

    #claude-code#multi-agent#ai-agent+2
  3. AI / ML·vercel-blogVercel Blog·

    AI Gateway에서 실시간 음성 에이전트 구축하기

    Vercel AI Gateway가 음성·오디오 기능을 정식 지원한다. 실시간 대화 음성(Realtime Voice), 텍스트→음성(TTS), 음성→텍스트(STT) 세 가지를 기존 텍스트/이미지 모델과 동일한 라우팅·인증·모니터링 체계 위에서 사용할 수 있다. OpenAI gpt-realtime-2·Whisper와 xAI Grok 오디오 모델을 지원하며, AI SDK 7 베타로 제공된다.

    #llm-app#ai-sdk#realtime-voice+2