Zyphra, Zamba2-VL 출시: 시간 단축을 이룬 하이브리드 비전-언어 모델

Zyphra는 최근 Zamba2-VL이라는 새로운 비전-언어 모델 제품군을 출시했습니다. 이 모델은 각각 1.2B, 2.7B, 7B 파라미터를 가지고 있으며, 하이브리드 Mamba2 상태 공간과 Transformer 백본을 사용합니다. Zamba2-VL은 Apache 2.0 라이선스 하에 제공되며, 기존의 Transformer 기반 비전-언어 모델과 경쟁력을 유지하면서도 첫 번째 토큰 생성 시간을 약 10배 단축하는 성과를 이뤘습니다. 이러한 혁신은 인공지능 및 기계 학습 분야에서의 응용 가능성을 더욱 넓히고 있습니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자