InfinityStar de ByteDance muestra que los modelos autoregresivos ahora pueden rivalizar con la difusión en la generación de vídeo. Utilizando su novedoso modelado de "pirámide espacio-temporal", no solo crearon un modelo de vídeo unificado, sino que además es 10 veces más rápido que los enfoques de generación de vídeo basados en difusión sin sacrificar la calidad