Xiaomi, 더 강력한 수학 및 코드 추론 능력을 갖춘 소형 언어 모델 MiMo-7B 발표

인공지능 시스템이 다단계 논리, 수학적 증명, 소프트웨어 개발 등의 작업을 처리할 수 있는 능력에 대한 수요가 증가함에 따라, 연구자들은 모델의 추론 능력을 향상시키기 위해 주목하고 있다. 이 능력은 이전에는 인간 지능에만 존재한다고 여겨졌지만, 이제는 더 효율적이고 널리 배포 가능한 소형 모델에서도 적극적으로 추구되고 있다. Xiaomi는 MiMo-7B라는 소형 언어 모델을 소개했는데, 이 모델은 더 큰 모델보다 더 우수한 수학 및 코드 추론 능력을 갖추고 있으며, 사전 훈련과 강화 학습을 통해 개발되었다. 더 많은 정보를 원한다면 링크를 참조해보시길 바란다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자