
Kaleido DIffusion: Improving Conditional DIffusion Models with Autoregressive Latent Modeling
·
Computer Vision Paper Review
classifier free guidance 가 만능이 아님을 느끼게 해주는 논문이었다classifier free guidance도 어떻게 보면 sample 의 diversity를 희생시키면서 guiding 하는거니까 그런가보다CFG를 temperature adjusted distribution으로 해석하는 부분도 재밌었다마트료시카 디퓨전? 처음 들어보는 거였는데, implementation 백본으로 마트료시카 디퓨전을 썼다고 해서 논문 찾아봤는데 이것도 꽤 흥미로웠다어떻게 12 million 이미지만으로 stable diffusion이랑 겨룰 수 있지? 물론 지금 stable diffusion이 더 잘하긴 하지만 stable 디퓨전은 최소! 600million부터 시작하는데 그냥 스케일이 다른듯,,굳이..