마이크로소프트 AI, MAI-Transcribe-1.5 출시: 2.4% 단어 오류율과 5배 빠른 오디오 전사 속도
마이크로소프트 AI가 자사의 음성 인식 모델인 MAI-Transcribe-1.5를 발표했습니다. 이 모델은 43개 언어를 지원하며, 특정 도메인에 맞는 용어에 대한 키워드 편향 기능을 추가했습니다. MAI-Transcribe-1.5는 인공지능 분석 리더보드에서 2.4%의 단어 오류율(Word-Error-Rate, WER)을 기록하며, 이는 업계에서 매우 우수한 성능으로 평가받고 있습니다. 또한, 이 모델은 1시간 분량의 오디오를 15초 이내에 전사할 수 있는 능력을 갖추고 있어, 긴 오디오 파일의 전사 속도가 최대 5배 빨라졌습니다. MAI-Transcribe-1.5는 현재 Azure AI Foundry에서 일반 사용자에게 제공되고 있습니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자