이미지 평가가 더 간단해진다: Google 연구원들이 비싼 API 없이 텍스트 정렬과 주제 일관성을 동시에 점수화하는 REFVNLI를 소개

텍스트-이미지(T2I) 생성은 참조 이미지를 텍스트 프롬프트와 함께 통합하여 표준 T2I 모델을 강화하는 주제 중심 접근 방식으로 발전해왔다. 이 발전은 생성된 이미지에서 보다 정확한 주제 표현을 가능케 한다. 약속된 응용 프로그램에도 불구하고, 주제 중심 T2I 생성은 신뢰할 수 있는 자동 평가 방법의 부족이라는 중요한 도전에 직면하고 있다. 현재의 메트릭은 텍스트 프롬프트 또는 참조 이미지에만 초점을 맞추는 경향이 있어서, 이러한 한계를 극복하기 위해 Google 연구원들은 REFVNLI를 도입했다. REFVNLI는 텍스트 정렬과 주제 일관성을 동시에 평가하고 점수화하여 주제 중심 T2I 생성의 품질을 개선하는 데 도움을 준다. 이를 통해 비용이 들지 않는 API를 사용하여 텍스트 정렬과 주제 일관성을 함께 평가할 수 있는 강력한 도구가 제공된다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자