010:00 – 4:45
GPT와 트랜스퍼 러닝, 그리고 첫 고민들
GPT서비스팀 오해진이 GPT를 서비스에 어떻게 적용할지 고민하며 만들어진 팀의 첫 프로덕트를 소개한다. GPT는 LLM의 한 종류로, ChatGPT 인기 이전부터 다양한 LLM이 발전해 왔고 우아한형제들도 올봄부터 활용을 고민했다. 발표자가 꼽은 LLM의 가장 흥미로운 점은 트랜스퍼 러닝 이다. 특정 태스크를 학습한 모델의 지식을 다른 다운스트림 태스크에 재사용하는 기법인데, 모델이 대용량으로 커지며(GPT-3는 1,750억 파라미터, GPT-4는 약 2,200억 파라미터 모델 여덟 개 혼합으로 알려짐) 변화가 생겼다. 과거에는 파인튜닝을 거쳐야 세부 태스크를 수행했지만, 이제는 파인튜닝 없이도 인간과 유사하게 종합적 추론 이 가능해지는 방향으로 발전한다. 즉 개체명 인식·감성분석을 별도 트레이닝하지 않아도 대용량 파운데이션 모델이 꽤 잘하는 것이다. 첫 고민은 어떤 버전을 쓸지였는데, 팀이 시작한 6월엔 GPT-4가 API로 제공되지 않아 ChatGPT 권한이 조금씩 열리던 시기였다.