오픈소스 TTS가 새로운 높이에 도달: 나리 랩스, 1.6B 파라미터 모델 ‘Dia’ 출시
텍스트 음성 변환(TTS) 시스템의 발전은 최근 큰 폭으로 진보되었는데, 특히 대규모 신경망 모델의 등장으로 더욱 발전되고 있다. 하지만 대부분의 고품질 시스템은 프로퍼티 API나 상용 플랫폼 뒤에 숨겨져 있다. 이러한 공백을 메우기 위해 나리 랩스는 1.6조 파라미터 TTS 모델 ‘Dia’를 Apache 2.0 라이센스로 공개했다. 이 모델은 사용자 기기에서 실시간 음성 복제와 표현력 있는 음성 합성을 제공한다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자