Ithaca Model 37 Video Song

Improved Video VAE for Latent Video Diffusion Model

Abstract: Variational Autoencoder (VAE) aims to compress pixel data into low-dimensional latent space, playing an important role in OpenAI’s Sora and other latent video diffusion generation models.

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Feedback

Improved Video VAE for Latent Video Diffusion Model

Trending now