O InfinityStar da ByteDance mostra que modelos autoregressivos agora podem rivalizar com a difusão na geração de vídeo! Usando seu novo modelo de "pirâmide do espaço-tempo", eles não apenas criaram um modelo de vídeo unificado, mas também é 10x mais rápido do que as abordagens de geração de vídeo baseadas em difusão, sem sacrificar a qualidade.