루닛

lunit

루닛의 엔지니어링 블로그. 매시간 RSS로 자동 수집해요.

원문 사이트 ↗📡RSS

3

전체

+0

이번 주

최신

AI / ML·루닛·1주 전
Dr.GRPO를 직접 발명할 수도 있었다
2025년에 등장한 Dr.GRPO는 GRPO의 편향 문제를 수정한 언어 모델 강화학습 알고리즘이다. 이 글은 REINFORCE(1992)부터 Dr.GRPO까지 각 알고리즘이 전임자의 결함을 어떻게 해결하는지 순차적으로 유도하며, 독자가 '직접 발명할 수 있었다'는 관점에서 전개한다. 수식보다 직관을 강조하면서도 기술 정밀도를 유지한다.
#llm-app#reinforcement-learning#grpo+2
AI / ML·루닛·2024년
AutoSCOPE — Lunit 의 AI 모델 개발 조립 라인
Lunit의 의료 AI 개발 과정이 데이터 준비부터 추론까지 약 10개의 수동 단계로 쪼개져 있어 모델 개발 속도가 느리고 팀 간 소통 비용이 크다.
AI / ML·루닛·2024년
Bayesian Optimization 과 Self-Distillation 의 결합
의료 영상 모델의 하이퍼파라미터 튜닝은 수동으로 하기엔 비효율적이고 베이지안 최적화 단독으로는 고차원 공간에서 한계가 있다.