InfinityStar от ByteDance показывает, что авторегрессионные модели теперь могут соперничать с диффузией в генерации видео! Используя их новую модель "пирамида пространства-времени", они не только создали унифицированную модель видео, но она также в 10 раз быстрее, чем подходы к генерации видео на основе диффузии, не жертвуя качеством.