2025년 6월 14일 토요일
오늘의 신문
2025년 6월 14일 토요일 오늘의 신문
NVIDIA, 파라킷 TDT 0.6B 공개: 음성인식에서 새로운 표준 세우며 오디오 1시간을 1초에 전사
발행일: 2025년 5월 6일 오전 1시 47분

NVIDIA가 최신 자동 음성인식(ASR) 모델인 파라킷 TDT 0.6B를 Hugging Face에서 완전히 오픈소스로 공개했다. 이 모델은 6억 개의 파라미터, 상업적으로 허용되는 CC-BY-4.0 라이센스, 그리고 놀라운 실시간 요소(RTF) 3386을 가지고 있어 음성 AI 분야에서 성능과 접근성에 새로운 기준을 제시하고 있다. 빠른 속도와 정확성을 자랑하는 이 모델은 1초에 1시간의 오디오를 전사할 수 있는 능력을 갖추고 있다. 이러한 혁신적인 모델은 음성 인식 기술의 발전에 기여할 것으로 기대된다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자

본 기사에 대한 의견을 공유해주세요.