다국어 간 전이에서 언어 유사성이 미치는 영향 분석: 작업과 입력 표현이 중요

다국어 간 전이는 NLP 작업의 훈련 데이터 양을 늘리는 인기있는 방법입니다. 그러나 어떤 다국어 데이터를 포함해야 하는지에 대한 최적 전략은 여전히 명확하지 않습니다. 이전 연구는 종종 소수의 언어 가족에서 몇 가지 언어 또는 단일 작업에 초점을 맞추었습니다. 이러한 연구 결과가 더 다양한 언어와 작업에 어떻게 적용되는지는 여전히 미해결된 문제입니다. 이 연구에서는 다양한 언어 가족에서 263개 언어에 대한 다국어 간 전이를 분석함으로써 이 질문에 기여합니다. 또한, 세 가지 인기 있는 NLP 작업을 포함하여 다국어 간 전이의 효과를 탐구합니다.
출처: Apple
요약번역: 미주투데이 서현진 기자