2025년 4월 29일 화요일
오늘의 신문
2025년 4월 29일 화요일 오늘의 신문
NVIDIA, 언어 모델 사전 학습을 위한 반복적 데이터 혼합 최적화 프레임워크 CLIMB 소개
발행일: 2025년 4월 19일 오후 4시 59분

NVIDIA가 CLIMB 프레임워크를 소개했습니다. 대규모 언어 모델이 커짐에 따라, 사전 학습 데이터 선택은 중요한 문제가 되고 있습니다. 대부분의 대규모 언어 모델은 Common Crawl과 같은 대규모 웹 데이터셋에서 학습되는데, 이는 광범위한 커버리지를 제공하지만 명시적인 도메인 레이블이 부족합니다. 이는 데이터를 선별하는 데 어려움을 야기합니다. 이러한 도전에 대처하기 위해, NVIDIA는 CLIMB이라는 프레임워크를 발표하였습니다. CLIMB은 반복적인 데이터 혼합 최적화를 위한 프레임워크로, 언어 모델 사전 학습의 품질을 향상시키는 데 도움이 될 것으로 기대됩니다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자