OpenAI, o4-mini에 Reinforcement Fine-Tuning (RFT) 출시: 맞춤형 모델 최적화의 한 단계

OpenAI가 o4-mini 추론 모델에 Reinforcement Fine-Tuning (RFT)을 출시했습니다. 이 기술은 전문화된 작업에 맞게 기초 모델을 맞춤화하는 강력한 새로운 기술을 소개합니다. RFT는 강화 학습의 원칙을 기반으로 하며, 조직이 사용자 정의 목표와 보상 함수를 정의할 수 있어 모델이 향상되는 방식에 대해 상세한 제어를 제공합니다. 이는 표준 지도 학습의 세밀 조정이 제공하는 것 이상의 모델 개선을 가능케 합니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자