이상적이지 않은 말과 감정을 위한 해석 가능한 기본 요소로서의 음성 품질 차원

이상적이지 않은 말과 다른 말 조절은 핵심적인 특성을 설명하는 지각적 음성 품질 차원을 가지고 있습니다. 본 연구에서는 음성 품질 모델을 개발하고 이상적이지 않은 말과 다른 말 조절에 대해 평가하였습니다. 총 7가지 음성 및 말 조절 차원(이해 가능성, 부정확한 자음, 거친 목소리, 자연스러움, 단조음량, 단조음높이, 숨소리)에 대한 음성 품질 모델을 개발하였습니다. 이를 위해 434명의 화자로부터 11,184개의 샘플을 사용하였으며, 동결된 사전 훈련 모델로부터의 임베딩을 특징으로 사용하였습니다. 결과적으로, 우리의 조사는 음성 유발 효과에 걸쳐 강력한 성능과 강력한 일반화를 보여주었습니다.
출처: Apple
요약번역: 미주투데이 서현진 기자