NVIDIA, 파라킷 TDT 0.6B 공개: 음성인식에서 새로운 표준 세우며 오디오 1시간을 1초에 전사

NVIDIA가 최신 자동 음성인식(ASR) 모델인 파라킷 TDT 0.6B를 Hugging Face에서 완전히 오픈소스로 공개했다. 이 모델은 6억 개의 파라미터, 상업적으로 허용되는 CC-BY-4.0 라이센스, 그리고 놀라운 실시간 요소(RTF) 3386을 가지고 있어 음성 AI 분야에서 성능과 접근성에 새로운 기준을 제시하고 있다. 빠른 속도와 정확성을 자랑하는 이 모델은 1초에 1시간의 오디오를 전사할 수 있는 능력을 갖추고 있다. 이러한 혁신적인 모델은 음성 인식 기술의 발전에 기여할 것으로 기대된다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자