2025년 6월 14일 토요일
오늘의 신문
2025년 6월 14일 토요일 오늘의 신문
아마존 세이지메이커 하이퍼팟에서 일본어 능력을 향상시킨 일본 주권 LLM인 Training Llama 3.3 Swallow 훈련
발행일: 2025년 6월 13일 오전 11시 54분

도쿄 과학 연구소가 아마존 세이지메이커 하이퍼팟을 활용하여 70억 개의 파라미터를 가진 대규모 언어 모델인 Llama 3.3 Swallow을 성공적으로 훈련시켰다. 이 모델은 일본어 능력이 향상되어 일본어 작업에서 우수한 성능을 발휘하며, GPT-4o-mini 및 다른 선두 모델을 앞서고 있다. 이 프로젝트를 통해 개발된 훈련 인프라, 최적화 및 모범 사례에 대한 기술적인 세부 정보가 담긴 기술 보고서가 발표되었다. 이 보고서는 프로젝트 진행 중 발생한 기술적 도전과 해결책에 대해 상세히 기술하고 있다.

<AWS Blog 뉴스 본문 전체읽기>

출처: AWS Blog
요약번역: 미주투데이 최정민 기자

본 기사에 대한 의견을 공유해주세요.