2025년 6월 14일 토요일
오늘의 신문
2025년 6월 14일 토요일 오늘의 신문
분류기 없는 가이드는 예측자-교정자이다
발행일: 2025년 5월 1일 오전 12시 00분

분류기 없는 가이드(CFG)의 이론적 기초에 대해 조사하였습니다. CFG는 텍스트-이미지 확산 모델의 조건부 샘플링에 있어서 주요한 방법입니다. 그러나 다른 확산 측면과 달리 CFG는 이론적으로 불안정한 상태에 있습니다. 본 논문에서는 CFG가 DDPM(Denoising Diffusion Probabilistic Model)(Ho et al., 2020) 및 DDIM(Denoising Diffusion Implicit Model)(Song et al., 2021)과 상호작용하는 방식을 보여주며, CFG와 함께 사용된 어떤 샘플러도 gamma-제곱 분포 p(x|c)^γp(x)^{1−γ}를 생성하지 않음을 입증합니다. 또한, CFG의 행동을 명확히 하기 위해 이것이 예측자-교정자 방법(Song et al., 2020)의 한 종류이라는 것을 밝혀냅니다. 이로써 CFG에 대한 오해를 해소하고, 이를 통해 텍스트-이미지 확산 모델의 성능 향상에 기여할 것으로 기대됩니다.

<Apple 뉴스 본문 전체읽기>

출처: Apple
요약번역: 미주투데이 서현진 기자

본 기사에 대한 의견을 공유해주세요.