pile· — 한국 IT 기술블로그 큐레이션

최신

프론트엔드·LINE Engineering·3일 전
AI로 웹 엔지니어 없이 LINE 앱 안에서 그룹 영상 통화 서비스 만들기
LINE Planet 팀의 PM과 Android 엔지니어 두 명이 웹 전문 엔지니어 없이 LINE 앱 내에서 그룹 영상 통화 서비스를 개발한 과정을 다룬다. LIFF(LINE Front-end Framework)와 LINE Planet SDK를 활용해 React/Vite 기반 웹 앱을 구성했고, Firebase Cloud Functions로 별도 서버 인프라 없이 구현을 완료했다.
#react#webrtc#firebase+2
인프라 / DevOps·Vercel Blog·3일 전
서비스 간 안전한 내부 통신 구성
Vercel의 Service Bindings는 멀티 서비스 배포에서 서비스 간 안전한 내부 통신을 자동화한다. 한 서비스가 다른 서비스에 바인딩을 선언하면 Vercel이 환경 변수 주입, 내부 라우팅, TLS 암호화를 투명하게 처리해 공개 인터넷을 거치지 않고 HTTPS 통신이 가능하다.
#tls#microservices#service-bindings+1
보안·Cloudflare Blog·4일 전
사이트 소유자를 위한 새 AI 트래픽 제어 옵션
Cloudflare가 Content Independence Day 1주년을 맞아 웹사이트 소유자가 AI 트래픽을 목적별로 세분화해 제어할 수 있는 새 시스템을 공개했다. 기존 "AI 봇 차단" 토글을 넘어 Search·Agent·Training 세 카테고리로 봇을 분류하고, robots.txt에 콘텐츠 재사용 범위를 선언하는 새 use= 시그널을 도입했다. 멀티퍼포스 봇은 가장 제한적인 카테고리 규칙이 적용되며, 2026년 9월 15일부터 광고 페이지에 새 기본값이 적용된다.
#web-security#bot-management#robots-txt+2
아키텍처·Cloudflare Blog·4일 전
Monetization Gateway 공개: x402로 Cloudflare 뒤 모든 리소스에 과금하기
Cloudflare가 HTTP 402 상태 코드를 재활용한 오픈 결제 프로토콜 x402와 스테이블코인 정산을 결합한 Monetization Gateway를 발표했다. 웹페이지·데이터셋·API·MCP 도구 어디든 Cloudflare 뒤에 놓으면 사용량 기반 마이크로페이먼트를 붙일 수 있다. AI 에이전트가 광고를 안 보고 구독도 유지하지 않는 시대에, 개발자와 퍼블리셔가 콘텐츠·도구를 직접 과금할 수 있는 인프라를 엣지에서 제공하는 것이 핵심이다.
#http-protocol#x402#micropayment+2
기타·Vercel Blog·4일 전
konsistent로 에이전트와 개발자를 위한 코드 컨벤션 강제하기
Vercel이 TypeScript 코드베이스의 구조적 컨벤션을 강제하는 CLI 린터 konsistent를 오픈소스로 공개했다. TypeScript 타입 검사나 ESLint로는 다룰 수 없는 파일/폴더 구조 규칙을 빠르고 결정론적으로 검사하며, AI 에이전트와 인간 개발자 모두가 일관된 코드 구조를 유지하도록 돕는다.
#typescript#cli#linter+1
인프라 / DevOps·Vercel Blog·4일 전
Vercel CLI 드라이런 배포로 실제 배포 전 구성 미리 확인하기
Vercel CLI v54.17.2부터 vercel deploy --dry 명령으로 실제 파일 업로드 없이 배포 구성을 미리 검사할 수 있다. 프레임워크 감지 결과, 포함/제외 파일 목록, 디렉터리 크기 분포, 콘텐츠 해시까지 사전에 확인하고 나서 배포를 결정할 수 있어 의도치 않은 배포 실패를 예방한다.
#ci-cd#deployment#vercel-cli+1
AI / ML·인프런 (인프랩)·5일 전
학습 에이전트 — AI 두뇌 구축하기
인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.
#llm-as-a-judge#ai-agent#llm+2
AI / ML·네이버 D2·5일 전
AI 에이전트 회사 차리기: 설립부터 어디서든 동기화까지
네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.
#ai-agent#llm#claude-code+2
프론트엔드·Vercel Blog·5일 전
Vercel과 Shopify의 Hydrogen 전면 재설계
Vercel과 Shopify가 Hydrogen을 오픈소스·런타임 무관 프레임워크로 전면 재설계했다. 기존 Hydrogen은 빠른 헤드리스 스토어프런트 배포를 지원했지만 플랫폼 종속성이 있었고, 새 버전은 Svelte, Nuxt, Next.js 등 어느 JavaScript 프레임워크에서도 동작한다. 3레이어 아키텍처(코어/클라이언트/서버)로 재구성하면서 각 레이어가 명확한 역할을 분담한다.
#react#nextjs#i18n+2
인프라 / DevOps·Vercel Blog·5일 전
Vercel Services: 단일 프로젝트에서 풀스택 실행하기
Vercel이 프론트엔드와 백엔드를 단일 프로젝트에서 통합 배포할 수 있는 Vercel Services를 출시했다. vercel.json 하나로 Next.js 프론트엔드와 FastAPI 백엔드를 선언하고, 내부 서비스 간 통신은 공개 인터넷을 경유하지 않는 private binding으로 처리한다.
#microservices#vercel#fluid-compute+2
인프라 / DevOps·Discord Blog·5일 전
Discord API의 기능별 비용 귀속 시스템
Discord가 1,700개 이상의 API 엔드포인트와 700개 백그라운드 태스크를 단일 Python 코드베이스로 수백 개 Kubernetes 배포에서 운영하면서 기능별 인프라 비용을 귀속시키는 시스템을 구축했다. 클라우드 제공사가 Kubernetes 배포 단위까지만 비용을 나눠주기 때문에 메시징·스트리밍 등 개별 기능의 실제 비용을 파악하기 어려웠고, CPU 시간 직접 샘플링으로 이 문제를 해결했다.
#kubernetes#cost-optimization#observability+2
인프라 / DevOps·Vercel Blog·5일 전
Vercel Functions에서 Dockerfile로 컨테이너 배포하기
Vercel Functions가 이제 Dockerfile 또는 Containerfile을 사용해 HTTP 서버를 Fluid compute에 직접 배포할 수 있게 됐다. OCI 호환 이미지라면 언어 제약 없이(Go, Rust, Python 등) 배포 가능하며, 커밋마다 이미지를 자동으로 빌드·VCR 푸시·배포한다.
#container#vercel#fluid-compute+2
인프라 / DevOps·네이버 D2·6일 전
End to End 유저 모니터링, RUM으로 한방에 해결
네이버 ENGINEERING DAY 2026 발표. 별도 외부 솔루션 없이 내부에서 구현한 End-to-End Real User Monitoring 서비스 nFront RUM을 소개한다. 추가 비용 없이 AI 분석 리포트까지 제공하며, 프론트엔드 서비스 품질을 사용자 관점에서 측정한다.
#observability#real-user-monitoring#ai-analytics+1
AI / ML·Vercel Blog·6일 전
AI Gateway에서 실시간 음성 에이전트 구축하기
Vercel AI Gateway가 음성·오디오 기능을 정식 지원한다. 실시간 대화 음성(Realtime Voice), 텍스트→음성(TTS), 음성→텍스트(STT) 세 가지를 기존 텍스트/이미지 모델과 동일한 라우팅·인증·모니터링 체계 위에서 사용할 수 있다. OpenAI gpt-realtime-2·Whisper와 xAI Grok 오디오 모델을 지원하며, AI SDK 7 베타로 제공된다.
#llm-app#ai-sdk#realtime-voice+2
AI / ML·Dropbox Tech·1주 전
DSPy로 AI 평가를 더 나은 응답으로 전환하기 — Dropbox Dash Chat 사례
Dropbox가 Dash Chat 에이전트의 응답 품질을 높이기 위해 DSPy 최적화 프레임워크를 도입한 과정을 다룬다. 인간 레이블로 LLM 평가자(judge)를 보정하고, 보정된 judge로 에이전트의 시스템 프롬프트를 자동 최적화하는 두 단계 전략으로 불완전 답변 26% 감소와 토큰 사용 5.4% 절감을 달성했다.
#llm-evaluation#ai-agent#dspy+2
AI / ML·Pinterest Engineering·1주 전
Pinterest 파운데이션 모델의 선형에 가까운 분산 훈련 스케일링 달성기
Pinterest는 월 6억 명 이상의 사용자를 서비스하는 추천 시스템 파운데이션 모델의 분산 훈련 스케일링 문제를 다룬다. 초기 멀티 노드 확장 시 2노드에서 성능이 0.2x로 역행했고, AWS EFA 도입 후에도 4노드 기준 1.21x에 그쳤다. 5단계 최적화를 통해 4노드 3.9x, 8노드 7.5x의 거의 선형에 가까운 스케일링을 달성했다.
#embedding#pytorch#distributed-training+2
아키텍처·Cloudflare Blog·1주 전
Cloudflare Workflows에 사가 롤백을 구현한 방법
Cloudflare Workflows 엔진에 사가(Saga) 패턴 롤백 기능을 추가한 과정을 다룬다. 다단계 워크플로우에서 중간 단계가 실패했을 때 이전 단계의 부작용을 되돌리는 보상 로직(compensating action)을 각 step에 선언적으로 정의할 수 있게 됐다. Workers RPC의 callable reference를 활용해 엔진 재시작 후에도 핸들러를 복구할 수 있는 내구적 설계를 택했다.
#workflow-engine#cloudflare-workers#saga-pattern+2
AI / ML·Vercel Blog·1주 전
AI SDK 7 출시 — 에이전트 플랫폼으로의 전환
Vercel이 AI SDK 7을 출시하며 주간 1,600만 다운로드의 TypeScript AI 라이브러리를 단순 모델 호출 도구에서 풀스택 에이전트 플랫폼으로 전환했다. OpenAI·Anthropic·Google 등 주요 프론티어 모델의 추론 제어를 단일 API로 통합하고, 내구성 있는 에이전트 실행, 도구 승인, 비디오 생성까지 범위를 확장했다.
#llm-app#typescript#agent-engineering+2
AI / ML·루닛·1주 전
Dr.GRPO를 직접 발명할 수도 있었다
2025년에 등장한 Dr.GRPO는 GRPO의 편향 문제를 수정한 언어 모델 강화학습 알고리즘이다. 이 글은 REINFORCE(1992)부터 Dr.GRPO까지 각 알고리즘이 전임자의 결함을 어떻게 해결하는지 순차적으로 유도하며, 독자가 '직접 발명할 수 있었다'는 관점에서 전개한다. 수식보다 직관을 강조하면서도 기술 정밀도를 유지한다.
#llm-app#reinforcement-learning#grpo+2
AI / ML·Vercel Blog·1주 전
에이전트에게 제품 디자인을 가르치는 방법 — Vercel의 접근
Vercel이 코딩 에이전트에게 제품 디자인 의사결정 맥락을 제공하는 product-design 스킬 시스템을 구축한 과정을 공개했다. 에이전트는 코드는 읽을 수 있지만 PR 댓글·설계 검토·Slack 토론에 담긴 결정 이유는 접근 불가 — 이 정보 격차를 스킬(컨텍스트 제공), 린터(규칙 자동 강제), 검토 루프(증거 수집)의 세 계층으로 해소한다. 에이전트가 사용 가능한 스킬을 호출하지 못한 비율이 56%였다는 내부 측정이 이 시스템 개발의 직접 계기가 됐다.
#llm-app#design-system#agent-engineering+2
아키텍처·LY Corporation·1주 전
AI 시대의 개발 능력은 검증력으로 결정된다, Flava API Gateway 개발 중 배운 빠른 검증과 로컬 환경 구성 전략
LY Corporation 의 Flava API Gateway 개발팀이 AI 코딩 에이전트 도입 후 직면한 "빠른 코드 생성 vs 느린 검증" 문제를 해결한 전략을 공유한다. 스펙 주도 개발, 검증 자동화, 로컬 환경 재현성의 세 축으로 접근해 AI 에이전트가 즉각적인 피드백 루프 안에서 안정적으로 작동할 수 있는 개발 기반을 구축했다.
#test-automation#ai-agent#openapi+2