#agent-engineering — pile·

최신

AI / ML·Vercel Blog·1주 전
AI SDK 7 출시 — 에이전트 플랫폼으로의 전환
Vercel이 AI SDK 7을 출시하며 주간 1,600만 다운로드의 TypeScript AI 라이브러리를 단순 모델 호출 도구에서 풀스택 에이전트 플랫폼으로 전환했다. OpenAI·Anthropic·Google 등 주요 프론티어 모델의 추론 제어를 단일 API로 통합하고, 내구성 있는 에이전트 실행, 도구 승인, 비디오 생성까지 범위를 확장했다.
#llm-app#typescript#agent-engineering+2
AI / ML·Vercel Blog·1주 전
에이전트에게 제품 디자인을 가르치는 방법 — Vercel의 접근
Vercel이 코딩 에이전트에게 제품 디자인 의사결정 맥락을 제공하는 product-design 스킬 시스템을 구축한 과정을 공개했다. 에이전트는 코드는 읽을 수 있지만 PR 댓글·설계 검토·Slack 토론에 담긴 결정 이유는 접근 불가 — 이 정보 격차를 스킬(컨텍스트 제공), 린터(규칙 자동 강제), 검토 루프(증거 수집)의 세 계층으로 해소한다. 에이전트가 사용 가능한 스킬을 호출하지 못한 비율이 56%였다는 내부 측정이 이 시스템 개발의 직접 계기가 됐다.
#llm-app#design-system#agent-engineering+2
AI / ML·네이버 D2·1주 전
Kelos - 쿠버네티스 네이티브 자율 코딩 에이전트 프레임워크
네이버 ENGINEERING DAY 2026 발표. AI 코딩 에이전트와 그 실행 환경을 API로 추상화하고 관리할 수 있는 오픈소스 프레임워크 Kelos를 소개한다. 쿠버네티스 네이티브 설계로 코딩 에이전트의 자동화와 오케스트레이션을 지원한다.
#kubernetes#llm-app#agent-engineering+4
AI / ML·LINE Engineering·1주 전
시멘틱 컨텍스트 OS 설계: 에이전트 시스템의 토큰 스터핑을 넘어
LY Corporation Tech-Verse 2026에서 발표된 이 글은 LLM 기반 에이전트 시스템에서 컨텍스트 창을 단순히 더 크게 늘리는 것만으로는 한계가 있다는 문제의식에서 시작한다. 어텐션 희석, 컨텍스트 부패, 규칙 충돌 등 장기 실행 에이전트의 구조적 문제를 해결하기 위해 AST 기반 가지치기와 VFS 추상화를 결합한 시멘틱 컨텍스트 OS 아키텍처를 제안한다.
#agent-engineering#rag#llm+2
AI / ML·Cloudflare Blog·2주 전
Cloudflare Agents SDK 플랫폼 개방과 Flue 프레임워크
Cloudflare가 자체 Agents SDK를 개방형 런타임 플랫폼으로 전환해 외부 에이전트 프레임워크가 활용할 수 있도록 했다. Astro 팀이 만든 오픈소스 프레임워크 Flue가 첫 번째 채택자로 합류했다. 단순 SDK 제공을 넘어 다양한 프레임워크가 Cloudflare 인프라(영속 실행·SQLite 상태 저장·동적 코드 실행)를 공유하는 생태계 확장을 의미한다.
#agent-engineering#llm#ai-agents+2
AI / ML·네이버 D2·2주 전
도구에서 동료로 — AI 에이전트 자율 성장 프레임워크
네이버 ENGINEERING DAY 2026 발표. 매 세션마다 초기화되는 AI의 근본 한계를 넘어, 경험을 축적하고 스스로 성장하는 에이전트 프레임워크 GNOSIS의 설계 원칙과 구현 사례를 소개한다. 3-Loop 구조, Constitution, 5층 기억 아키텍처, 수학적 안전 보장까지 포함한 종합 프레임워크다.
#agent-engineering#ai-agent#llm+4
AI / ML·Vercel Blog·2주 전
에이전트 스택 — Vercel의 프로덕션 AI 에이전트 인프라
Vercel이 프로덕션 AI 에이전트 구축을 위한 통합 인프라 스택을 공개했다. 모든 에이전트가 공통으로 필요로 하는 세 가지 기능(모델 연결, 워크플로우 실행, 데이터/도구 통합)을 하나의 플랫폼으로 묶어 제공한다. 지원 티켓 자동화부터 코드 작성 에이전트까지, 에이전트 유형과 무관하게 동일한 인프라 블록이 필요하다는 관찰에서 출발한 설계다.
#llm-app#agent-engineering#mcp+2
AI / ML·Vercel Blog·2주 전
eve — 프로덕션 AI 에이전트 오픈소스 프레임워크
Vercel이 프로덕션 AI 에이전트 구축을 위한 오픈소스 프레임워크 eve를 출시했다. 에이전트를 파일 시스템 디렉토리 트리로 표현하는 방식으로, 내구성 있는 실행, 샌드박스, 인간 승인 루프, evals 기능을 기본 내장한다. Vercel 내부에서 100개 이상의 프로덕션 에이전트를 운영하며 검증한 패턴을 오픈소스로 공개한 것이다.
#llm-app#typescript#agent-engineering+2
AI / ML·Slack Engineering·3주 전
에이전트 기반 테스팅: E2E 테스트 스택에서 에이전트의 위치
Slack 엔지니어링 팀이 AI 에이전트를 E2E 테스트 자동화에 적용한 실험 결과를 공유한다. 200회 이상의 자동화 실행으로 신뢰성·속도·비용을 정량 측정해, 기존 결정론적 테스트와 에이전트 기반 테스트가 각각 어느 단계에 적합한지 구분했다.
#llm-app#ci-cd#agent-engineering+2
AI / ML·Vercel Blog·3주 전
4명이 12만 기업의 AI CMO 에이전트를 운영하는 방법 — Okara 아키텍처
4명 팀의 Okara가 하루 40억 토큰을 처리하며 120,000개 이상의 기업에 AI CMO 에이전트 서비스를 제공한다. 8개 하위 에이전트(SEO, GEO, 소셜미디어 등)로 구성된 멀티에이전트 시스템과 Vercel 인프라를 활용해 소규모 팀이 대규모 서비스를 운영하는 방법을 보여준다.
#llm-app#agent-engineering#multi-agent+2
AI / ML·AWS Korea Tech·3주 전
Amazon Bedrock 위에서 Codex와 Claude Code 함께 쓰기: Harness Engineering으로 구현해보기
AWS 기술 블로그의 이 글은 Claude Code(Anthropic)와 Codex(OpenAI)를 Amazon Bedrock에서 함께 운용하는 멀티 에이전트 협업 하네스 설계와 48런 벤치마크 결과를 다룬다. "어떤 도구가 더 나은가"가 아니라 "어떻게 연결해야 더 나은 결과를 내는가"에 답하며, 산출물 전달·리뷰 보관·계측·재시도를 묶은 하네스가 모델 선택보다 협업 성패를 더 크게 좌우한다는 결론을 제시한다.
#llm-app#agent-engineering#multi-agent+2
아키텍처·GitLab Blog·3주 전
GitLab Orbit: 코드·SDLC 전체 컨텍스트를 단일 쿼리로
GitLab이 소프트웨어 개발 생명주기(SDLC) 전반의 데이터를 단일 그래프로 연결하는 Orbit을 공개 베타로 출시했다. AI 에이전트가 파이프라인·배포·이슈·소유권을 코드와 연결해 이해하려면 파편화된 컨텍스트를 넘어 전체 SDLC를 그래프로 탐색할 수 있어야 한다는 문제에서 출발한다.
#agent-engineering#knowledge-graph#clickhouse+4
AI / ML·토스 SLASH·3주 전
Skill 품질 관리를 위한 Rubric 설계와 시스템 구현
사내 공용 Skill의 트리거 실패(에이전트 미호출)와 형식 위반 결함이 반복적으로 발생한다.
#llm-app#github-actions#developer-experience+2
AI / ML·Spotify Engineering·1개월 전
코딩은 더 이상 제약이 아니다: Spotify에서 팀과 AI 에이전트까지 개발자 경험 확장하기
Spotify가 AI 코딩 도구를 조직 전반에 확산하며 얻은 결론은 "코딩은 더 이상 병목이 아니고, 이제 무엇을 만들지 결정하는 일이 새 병목"이라는 것이다. 프로덕션 코드베이스가 엔지니어 수보다 7배 빠르게 커지며 폭증한 유지보수 부담을, 배경 코딩 에이전트 Honk와 자동화 파이프라인으로 흡수한 과정을 다룬다.
#kubernetes#developer-experience#claude+2
AI / ML·Twilio Engineering·1개월 전
대화형 AI 제대로 구축·배포하기: 8단계 실전 가이드
대화형 AI는 개발은 쉽지만 프로덕션 배포에서 대부분 실패한다. 이 글은 가장 흔한 실패 지점인 핸드오프(에스컬레이션) 설계와 메모리 계층 부재를 중심으로 처음부터 제대로 배포하기 위한 8단계 가이드를 제시한다.
#llm-app#agent-engineering#observability+2
AI / ML·교보DTS·1개월 전
AI 에이전트를 안전하게 움직이게 하는 설계도, ‘하네스 엔지니어링(Harness Engineering)’
AI 에이전트를 규칙·도구·검증 체계 없이 운영하면 일관성 부족, 보안 리스크, 팀 확장의 어려움이 발생한다.
#llm-app#agent-engineering#ai-agent+2
AI / ML·AWS Korea Tech·1개월 전
Strands와 AgentCore를 활용해 Amazon RDS for SQL Server용 에이전틱 AI 구축하기
Amazon RDS for SQL Server 의 deadlock·blocking 진단을 사람이 매번 T-SQL 스크립트로 돌리던 일을, Strands Agents 와 Amazon Bedrock AgentCore 로 자동화한 사례를 다룬다. 기존 진단 쿼리를 Python @tool 로 감싸고 LLM 추론·메모리를 붙여, DBA 가 자연어로 묻고 SNS 보고서까지 받는 에이전트를 구축한다.
#llm-app#agent-engineering#aws-rds+2
AI / ML·Stack Overflow Blog·1개월 전
AI 코딩 에이전트 오케스트레이션 실전 경험기
O'Reilly 저자 Andrew Stellman 이 Claude Code 와 Gemini 를 조율해 21,000줄 Python 배치 처리 도구 Octobatch 를 약 75시간에 만든 경험에서, AI 코딩 에이전트를 실전에서 오케스트레이션하는 법을 정리한다. 핵심은 AI 와의 개발이 오히려 개발자에게 더 높은 기준을 요구한다는 점 — 좋은 코드 감각·아키텍처 유지·실패 패턴 감지·단순성 추구가 성패를 가른다.
#prompt-engineering#agent-engineering#llm+2
AI / ML·LINE Engineering·1개월 전
ODW #7: 세 가지 방법으로 토큰 소비량 40% 절감! ADK를 이용한 컨텍스트 엔지니어링
사내 AI 툴 도입 확산에 따라 토큰 소비가 예상치를 초과하고, 긴 대화에서 컨텍스트 누적으로 AI 출력 품질이 저하되는 문제가 발생했다.
#agent-engineering#llm#context-engineering+2
AI / ML·AWS Korea Tech·1개월 전
현대오토에버 GenAI Sandbox 해커톤 — 생성형 AI 업무 자동화 사례
현대오토에버가 사내 팀들이 보안·예산·권한 같은 관료적 장벽 없이 GenAI 서비스를 직접 만들 수 있게 한 "GenAI Sandbox"와, 그 위에서 진행한 4주 해커톤(14팀 150명) 사례를 다룬다. 사전 통제된 환경에서 업무 자동화 프로토타입을 빠르게 검증하는 방식을 보여준다.
#llm-app#agent-engineering#amazon-bedrock+2