싱가포르 국립대학 연구진, ‘Thinkless’ 소개: DeGRPO를 활용해 불필요한 추론 90% 줄임

언어 모델의 효과성은 인간과 유사한 단계별 추론을 모방하는 능력에 의존한다. 그러나 이러한 추론 순서는 자원이 많이 소모되며, 복잡한 계산이 필요하지 않은 간단한 질문에는 낭비일 수 있다. 이러한 모델들에서 주요한 도전 과제 중 하나는 과업의 복잡성에 대한 인식의 부족이다. 종종 이러한 모델들은 기본적으로 […]
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자