자가 학습하는 AI: Tsinghua 대학의 ‘Absolute Zero’가 외부 데이터 없이 LLM을 훈련시킴

Tsinghua 대학의 ‘Absolute Zero’는 외부 데이터 없이 LLM을 훈련시키는데 성공하였다. 현재의 RLVR 작업은 규모 확장 문제에 직면하고 있지만, ‘Absolute Zero’는 중간 추론 단계를 모방하는 대신 결과 기반 피드백에 의존하여 추론 능력을 향상시켰다. 현재까지 RLVR은 질문과 답변의 수동으로 정리된 컬렉션에 많이 의존하고 있어 훈련에 큰 어려움을 겪고 있다. 추론 모델이 발전함에 따라 대규모고 고품질의 데이터셋을 구축하는 것이 중요한데, ‘Absolute Zero’는 이러한 어려움을 극복하는 데 성공했다. Tsinghua 대학은 AI 기술 발전에 큰 기여를 하고 있으며, ‘Absolute Zero’의 성과는 AI 분야에 미래의 가능성을 제시하고 있다.
#AIPaperSummary #Applications #ArtificialIntelligence #EditorsPick #LargeLanguageModel #Machinelearning #TechNews #Technology
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자