학습 에이전트 — AI 두뇌 구축하기
인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.
인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.
네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.
Vercel AI Gateway가 음성·오디오 기능을 정식 지원한다. 실시간 대화 음성(Realtime Voice), 텍스트→음성(TTS), 음성→텍스트(STT) 세 가지를 기존 텍스트/이미지 모델과 동일한 라우팅·인증·모니터링 체계 위에서 사용할 수 있다. OpenAI gpt-realtime-2·Whisper와 xAI Grok 오디오 모델을 지원하며, AI SDK 7 베타로 제공된다.
Dropbox가 Dash Chat 에이전트의 응답 품질을 높이기 위해 DSPy 최적화 프레임워크를 도입한 과정을 다룬다. 인간 레이블로 LLM 평가자(judge)를 보정하고, 보정된 judge로 에이전트의 시스템 프롬프트를 자동 최적화하는 두 단계 전략으로 불완전 답변 26% 감소와 토큰 사용 5.4% 절감을 달성했다.
Pinterest는 월 6억 명 이상의 사용자를 서비스하는 추천 시스템 파운데이션 모델의 분산 훈련 스케일링 문제를 다룬다. 초기 멀티 노드 확장 시 2노드에서 성능이 0.2x로 역행했고, AWS EFA 도입 후에도 4노드 기준 1.21x에 그쳤다. 5단계 최적화를 통해 4노드 3.9x, 8노드 7.5x의 거의 선형에 가까운 스케일링을 달성했다.
Vercel이 AI SDK 7을 출시하며 주간 1,600만 다운로드의 TypeScript AI 라이브러리를 단순 모델 호출 도구에서 풀스택 에이전트 플랫폼으로 전환했다. OpenAI·Anthropic·Google 등 주요 프론티어 모델의 추론 제어를 단일 API로 통합하고, 내구성 있는 에이전트 실행, 도구 승인, 비디오 생성까지 범위를 확장했다.
2025년에 등장한 Dr.GRPO는 GRPO의 편향 문제를 수정한 언어 모델 강화학습 알고리즘이다. 이 글은 REINFORCE(1992)부터 Dr.GRPO까지 각 알고리즘이 전임자의 결함을 어떻게 해결하는지 순차적으로 유도하며, 독자가 '직접 발명할 수 있었다'는 관점에서 전개한다. 수식보다 직관을 강조하면서도 기술 정밀도를 유지한다.
Vercel이 코딩 에이전트에게 제품 디자인 의사결정 맥락을 제공하는 product-design 스킬 시스템을 구축한 과정을 공개했다. 에이전트는 코드는 읽을 수 있지만 PR 댓글·설계 검토·Slack 토론에 담긴 결정 이유는 접근 불가 — 이 정보 격차를 스킬(컨텍스트 제공), 린터(규칙 자동 강제), 검토 루프(증거 수집)의 세 계층으로 해소한다. 에이전트가 사용 가능한 스킬을 호출하지 못한 비율이 56%였다는 내부 측정이 이 시스템 개발의 직접 계기가 됐다.
LY Corporation 엔지니어링 팀이 단일 AI 에이전트 방식에서 Proposer-Challenger-Orchestrator 구조의 멀티 에이전트 협업 모델로 개발 프로세스를 재설계한 경험을 공유한다. AI-assist 환경에서 "개별 단계는 빠르지만 단계 간 사람 조율에서 병목"이 생기는 문제를 에이전트 간 구조화된 토론으로 해결했다.
네이버 ENGINEERING DAY 2026 발표. AI 코딩 에이전트와 그 실행 환경을 API로 추상화하고 관리할 수 있는 오픈소스 프레임워크 Kelos를 소개한다. 쿠버네티스 네이티브 설계로 코딩 에이전트의 자동화와 오케스트레이션을 지원한다.
LY Corporation Tech-Verse 2026에서 발표된 이 글은 LLM 기반 에이전트 시스템에서 컨텍스트 창을 단순히 더 크게 늘리는 것만으로는 한계가 있다는 문제의식에서 시작한다. 어텐션 희석, 컨텍스트 부패, 규칙 충돌 등 장기 실행 에이전트의 구조적 문제를 해결하기 위해 AST 기반 가지치기와 VFS 추상화를 결합한 시멘틱 컨텍스트 OS 아키텍처를 제안한다.
네이버 ENGINEERING DAY 2026 발표. SNOW 플랫폼에서 수천 개의 AI 서비스가 한정된 GPU 자원을 효율적으로 공유하기 위해 Automatic Sharding 기술을 도입한 과정을 다룬다. Manual Sharding의 운영 부담을 해소하고, 모델 로딩 오버헤드를 제거해 AI 모델 서빙 효율을 높였다.
Yahoo! JAPAN Search에서 LLM 프롬프트 튜닝을 수작업에서 유전 알고리즘(GEPA) 기반 자동화로 전환한 과정을 다룬다. 기존 방식은 수일~수주가 걸리고 노하우가 개인에게만 쌓이는 문제가 있었으며, GEPA와 DSPy 프레임워크 도입 후 같은 작업을 약 1시간으로 단축하고 요건 준수율 거의 100%를 달성했다.
토스 Technical Writing 팀이 AI Skill을 개발해 문서 작성과 검토 과정을 자동화한 경험을 다룬다. 4,000명 규모 조직에 TW가 3명뿐인 구조에서 기능 변화 속도를 문서가 따라가지 못하는 문제를 해결하기 위해, TW의 암묵지를 체계화하고 AI Skill로 배포해 개발자가 직접 문서화하는 구조를 만들었다.
네이버 ENGINEERING DAY 2026 발표. AI 에이전트가 엉뚱한 답변을 하는 근본 원인이 컨텍스트 부족임을 진단하고, 팀 데이터와 서빙 레이어 자산을 자동 수집해 에이전트에게 제공하는 Agentic Context Platform을 구축한 경험을 공유한다.
LY Corporation이 비즈니스 질문부터 데이터 분석, 인사이트 도출까지 전 과정을 자동화하는 생성형 AI 기반 분석 에이전트 시스템 PJ One Piece를 구축했다. 기존 평균 2주 걸리던 분석 리드타임을 약 10분으로 단축하고, 월 10건이던 분석 건수를 수백 건으로 늘리며 사용자층을 데이터 사이언티스트에서 부서 구성원 절반 이상으로 확대했다.
네이버 ENGINEERING DAY 2026 발표. 쇼핑 에이전트 답변 모델 개발에서 입력 스펙이 자주 바뀌는 문제를 해결하기 위해, 변경된 스펙만 입력하면 결함 탐지·프롬프트 최적화·SFT 학습 데이터 생성을 에이전트가 폐쇄 루프로 자동화하는 파이프라인을 설계한 경험을 다룬다.
Cloudflare가 자체 Agents SDK를 개방형 런타임 플랫폼으로 전환해 외부 에이전트 프레임워크가 활용할 수 있도록 했다. Astro 팀이 만든 오픈소스 프레임워크 Flue가 첫 번째 채택자로 합류했다. 단순 SDK 제공을 넘어 다양한 프레임워크가 Cloudflare 인프라(영속 실행·SQLite 상태 저장·동적 코드 실행)를 공유하는 생태계 확장을 의미한다.
네이버 ENGINEERING DAY 2026 발표. 매 세션마다 초기화되는 AI의 근본 한계를 넘어, 경험을 축적하고 스스로 성장하는 에이전트 프레임워크 GNOSIS의 설계 원칙과 구현 사례를 소개한다. 3-Loop 구조, Constitution, 5층 기억 아키텍처, 수학적 안전 보장까지 포함한 종합 프레임워크다.
Vercel이 프로덕션 AI 에이전트 구축을 위한 통합 인프라 스택을 공개했다. 모든 에이전트가 공통으로 필요로 하는 세 가지 기능(모델 연결, 워크플로우 실행, 데이터/도구 통합)을 하나의 플랫폼으로 묶어 제공한다. 지원 티켓 자동화부터 코드 작성 에이전트까지, 에이전트 유형과 무관하게 동일한 인프라 블록이 필요하다는 관찰에서 출발한 설계다.