학습 에이전트 — AI 두뇌 구축하기
인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.
v0가 단순 코드 생성기를 넘어 실제로 작동하는 코딩 에이전트가 된 방법을 다루는 글이다. Vercel 팀이 v0에 적용한 세 가지 핵심 컴포넌트 — 동적 시스템 프롬프트, LLM Suspense 스트리밍 레이어, 자동 수정기(Autofixer) — 를 상세히 공개했다. 코딩 에이전트를 직접 만들거나 개선하려는 엔지니어에게 실질적인 구현 패턴을 제공한다.
첫째 URL 압축: 코드 내 긴 외부 URL을 축약된 내부 참조로 교체해 컨텍스트 창을 절약한다.
둘째 lucide-react 아이콘 수정: LLM이 존재하지 않는 아이콘 이름을 환각하는 경우, 런타임에 실제 export 목록을 분석해 가장 가까운 실존 아이콘으로 100ms 내에 교체한다. 스트리밍 완료 이후가 아니라 스트리밍 도중에 처리하기 때문에 사용자 체감 지연이 없다.
인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.
네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.
Vercel AI Gateway가 음성·오디오 기능을 정식 지원한다. 실시간 대화 음성(Realtime Voice), 텍스트→음성(TTS), 음성→텍스트(STT) 세 가지를 기존 텍스트/이미지 모델과 동일한 라우팅·인증·모니터링 체계 위에서 사용할 수 있다. OpenAI gpt-realtime-2·Whisper와 xAI Grok 오디오 모델을 지원하며, AI SDK 7 베타로 제공된다.