Mon premier article @delphi_intel porte sur les modèles vidéo Gen AI. Résumé ci-dessous (1/10) 👇 s/o à @moonshot6666 pour ses commentaires sur cet essai et @PJaccetturo pour cette vidéo de battage médiatique que je volerai sans vergogne. TLDR : les vidéos ont 2-3 ans de retard sur le texte. Ils deviennent très bons, très rapides
1. Les humains sont des créatures visuelles. La modalité de contenu de l'IA générative tendra probablement vers une distribution similaire à celle du web :
2. Le marché est grand : >40 milliards de dollars américains + d’ici 2030 (avec les contiguïtés pertinentes). La perturbation du marketing, du divertissement et de l’éducation est évidente, mais ses implications sont également évidentes dans la robotique, la surveillance et les tâches agentiques à long terme
3. Le paysage a beaucoup de concurrence entre les piles Comprend des entreprises de modélisme, des applications multimodales, des avatars parlants, de la synchronisation labiale et plus encore. Sans parler de toute l’infrastructure nécessaire pour alimenter de véritables modèles et applications multimodaux. s/o pour @venturetwins et @a16z pour la carte
4. L’Est contre l’Ouest. La course est largement divisée entre les États-Unis et la Chine. Dans les modèles vidéo, la Chine est en tête (9 des 15 meilleurs modèles) s/o @ArtificialAnlys
6. Avantage Big Tech : l’utilisation de ces nouvelles capacités dans les écosystèmes d’utilisateurs >1B se traduira par un retour sur investissement élevé. Sur la base des attributs ci-dessous, il n’est pas choquant que les grands acteurs comme $Goog, $meta, $techy, $baba et Bytedance soient bien positionnés.
7. Accumulation de valeur : En même temps, nous voyons des poches à travers la pile - en particulier dans l'infrastructure et les applications - où de nouveaux entrants peuvent se tailler de grandes entreprises. (Oui, vous devrez lire le rapport réel pour obtenir des informations, paresseux.)
8. Vraie multimodalité Aujourd'hui, les modèles vidéo ressemblent à un jouet. Mais les données vidéo et les simulations sont un input de plus en plus essentiel pour des tâches agentiques de longue durée et pour amorcer la révolution de la robotique. Les modèles vidéo pourraient bien s'avérer être l'étincelle.
459