디커플드 디퓨전 트랜스포머: 시멘틱 디테일 분리와 인코더 공유를 통한 고품질 이미지 생성 가속화
디커플드 디퓨전 트랜스포머(Decoupled Diffusion Transformers)는 이미지 생성 작업에서 높은 품질의 이미지를 생성하기 위해 시맨틱 디테일 분리와 인코더 공유를 통해 가속화하는 방법을 제시하고 있다. 이 모델은 기존의 GAN 및 자기 회귀 아키텍처를 능가하는 성능을 보여주며, 전진 확산 과정에서 이미지에 점진적으로 노이즈를 추가한 뒤 이 과정을 되돌리는 방식으로 작동한다. 이를 통해 모델은 데이터 분포를 근사하게 학습하게 된다. UNet 기반 확산과는 달리, 디커플드 디퓨전 트랜스포머는 시맨틱 정보와 디테일을 분리하여 처리하고 인코더를 공유함으로써 효율적인 학습과 생성을 이루어낸다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자