pile·
AI / ML·cloudflare-blogCloudflare Blog·

Cloudflare Agents SDK 플랫폼 개방과 Flue 프레임워크

Cloudflare가 자체 Agents SDK를 개방형 런타임 플랫폼으로 전환해 외부 에이전트 프레임워크가 활용할 수 있도록 했다. Astro 팀이 만든 오픈소스 프레임워크 Flue가 첫 번째 채택자로 합류했다. 단순 SDK 제공을 넘어 다양한 프레임워크가 Cloudflare 인프라(영속 실행·SQLite 상태 저장·동적 코드 실행)를 공유하는 생태계 확장을 의미한다.

핵심 포인트
  • Cloudflare Agents SDK가 Flue 등 외부 프레임워크가 활용할 수 있는 개방형 런타임 플랫폼으로 전환됐다
  • 프레임워크(Flue) → 하니스(Pi/Project Think) → 런타임(Agents SDK) 3계층으로 에이전트 스택 역할을 분리한다
  • Fibers가 에이전트 상태를 Durable Object SQLite에 체크포인트해 중단 후 정확한 지점에서 재개를 보장한다
  • `@cloudflare/codemode`로 LLM 생성 코드를 동적 워커에서 10ms 이내, 로드당 $0.002에 실행할 수 있다
  • Flue는 선언적 접근으로 25줄 미만 코드로 버그 트리에이지 에이전트를 구현한다
상세 정리
  • 배경: 기존 Agents SDK는 Cloudflare 자체 도구에 묶여 있었다. 이번 개방으로 Flue 같은 독립 프레임워크도 동일한 런타임 기본 요소를 활용할 수 있게 됐다.
  • 3계층 분리: 프레임워크(Flue — 프로젝트 구조·CLI·통합) / 하니스(Pi, Project Think — 에이전트 루프·도구 호출·컨텍스트 관리) / 런타임(Agents SDK — 계산·상태·스토리지 기본 요소)로 역할을 명확히 나눴다.
  • Flue 설계 철학: "스크립팅이 아닌 에이전트가 알아야 할 것을 기술(describe)"하는 선언적 방식이다. Slack, GitHub, Linear, Discord 등 기존 플랫폼 통합이 내장돼 있다.
  • Flue 실행 방식: 헤드리스 실행과 React 훅을 통한 UI 모드를 모두 지원하며, 다중 클라우드 배포도 가능하다.
  • 영속 실행(Durable Execution): Fibers가 에이전트 실행 상태를 Durable Object SQLite에 체크포인트한다. 장시간 작업 중 중단돼도 정확한 지점에서 재개된다.
  • 코드 실행: LLM 생성 코드를 도구 목록 과부하 없이 실행한다. `@cloudflare/codemode`가 동적 워커에서 10ms 이내 실행을 보장하며 로드당 $0.002 비용이다.
  • 가상 파일시스템: `@cloudflare/shell`이 SQLite 기반 가상 파일시스템을 제공한다. 컨테이너 오버헤드 없이 텍스트 파일 작업을 처리한다.
  • 동적 워크플로우: 에이전트가 런타임에 다단계 파이프라인을 직접 작성하면 Workflows 엔진이 영속적으로 실행한다.
  • 에코시스템 바인딩: AI Gateway, Browser Run, Email Service, Agent Memory 등 Cloudflare 서비스에 바인딩으로 접근한다.
  • 실제 예시: 버그 리포트를 재현하고 진단하는 트리에이지 에이전트를 25줄 미만으로 구현하는 데모를 제시했다.
왜 읽나Cloudflare Workers 기반 AI 에이전트를 구축하거나 에이전트 프레임워크 설계(영속 실행·상태 관리·동적 코드 실행)를 검토하는 백엔드·ML 엔지니어에게 구체적인 아키텍처 레퍼런스다.
cloudflare-blog
Cloudflare Blog 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. AI / ML·인프랩 (인프런)인프런 (인프랩)·

    학습 에이전트 — AI 두뇌 구축하기

    인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.

    #ai-agent#llm#llm-as-a-judge+2
  2. AI / ML·네이버 D2네이버 D2·

    AI 에이전트 회사 차리기: 설립부터 어디서든 동기화까지

    네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.

    #claude-code#multi-agent#ai-agent+2
  3. AI / ML·vercel-blogVercel Blog·

    AI Gateway에서 실시간 음성 에이전트 구축하기

    Vercel AI Gateway가 음성·오디오 기능을 정식 지원한다. 실시간 대화 음성(Realtime Voice), 텍스트→음성(TTS), 음성→텍스트(STT) 세 가지를 기존 텍스트/이미지 모델과 동일한 라우팅·인증·모니터링 체계 위에서 사용할 수 있다. OpenAI gpt-realtime-2·Whisper와 xAI Grok 오디오 모델을 지원하며, AI SDK 7 베타로 제공된다.

    #llm-app#ai-sdk#realtime-voice+2