개선된 원문 대본 전사와 엔드 투 엔드 미스큐 탐지를 위한 프롬프팅 휘스퍼

현재 자동 음성 인식 (ASR) 전사와 대상 독해 텍스트를 비교하여 읽어주는 동안 발생한 실수 (즉, 미스큐)를 식별하는 것은 일반적으로 사후에 접근됩니다. 그러나 ASR이 원문 발언을 부정확하게 전사하는 경우 사후 방법은 성능이 저하됩니다. 읽기 오류 주석 방법을 개선하기 위해 대상 독해 텍스트를 프롬프팅하고 향상된 원문 전사 및 직접 미스큐 탐지를 위해 훈련된 혁신적인 엔드 투 엔드 아키텍처를 제안합니다. 주요 기여로는 먼저, …
출처: Apple
요약번역: 미주투데이 서현진 기자