Les modèles mondiaux en temps réel sont le développement le plus intéressant dans l'IA générative en ce moment, et presque personne ne fait attention. Le concept : au lieu de rendre un clip vidéo fixe, l'IA génère un environnement continu qui répond à votre input au fur et à mesure qu'il se déroule. Vous parlez, le monde change. Vous donnez une direction, les personnages réagissent. Pas d'attente, pas de re-rendu, pas de durée fixe. C'est différent de tout le reste dans la vidéo IA. Sora génère de magnifiques clips de 60 secondes. Runway vous donne un contrôle d'édition professionnel. Kling gère le travail de caméra cinématographique. Tous produisent des fichiers que vous regardez. Les modèles mondiaux en temps réel produisent des espaces que vous habitez. Google DeepMind travaille là-dessus depuis des années. Genie 1 a prouvé le concept. Genie 2 a ajouté des environnements 3D. Genie 3, sorti en août 2025, a atteint 720p à 24fps avec une cohérence durant quelques minutes. Mais DeepMind l'a gardé verrouillé dans un aperçu de recherche, disponible uniquement pour des universitaires et créateurs sélectionnés. PixVerse vient de changer cela. R1 a été lancé le 13 janvier. Il fonctionne dans votre navigateur. Ils distribuent des codes d'invitation et s'orientent vers un accès ouvert. Les spécifications techniques correspondent ou dépassent celles de Genie 3 : résolution 1080p, réponse en temps réel, génération continue. Leur architecture a trois éléments qu'il vaut la peine de comprendre. Le modèle Omni unifie texte, image, audio et vidéo en un seul flux de tokens au lieu de chaîner des systèmes séparés. Le cadre autoregressif permet une durée théoriquement illimitée en prédisant chaque image à partir de ce qui est venu avant. Le Moteur de Réponse Instantanée compresse l'échantillonnage de dizaines d'étapes à 1-4, ce qui rend la génération en temps réel possible. PixVerse a aussi quelque chose que DeepMind n'a pas : la distribution. 100 millions d'utilisateurs. 40 millions de dollars de revenus récurrents annuels. Alibaba menant une série B de 60 millions de dollars. Lorsque R1 dépassera le stade d'invitation uniquement, il y aura un public prêt à l'utiliser. Les contraintes sont réelles. Les séquences prolongées accumulent des erreurs de prédiction. La fidélité physique est échangée contre la vitesse. La cohérence tient pendant des minutes, pas des heures. Ces limites s'appliquent aussi à Genie 3. Les résoudre est la véritable course. Mais la trajectoire compte plus que les limitations actuelles. L'écart entre la consommation de contenu et la co-création se réduit. PixVerse parie qu'ils peuvent productiser cet avenir avant que quiconque ne livre quelque chose que les gens peuvent réellement toucher.