Première étude à grande échelle sur des agents IA fonctionnant réellement en production. Le battage médiatique dit que les agents transforment tout. Les données racontent une histoire différente. Les chercheurs ont interrogé 306 praticiens et ont mené 20 études de cas approfondies dans 26 domaines. Ce qu'ils ont trouvé remet en question les hypothèses courantes sur la façon dont les agents de production sont construits. La réalité : les agents de production sont délibérément simples et étroitement contraints. 1) Modèles et Fiabilité - 68 % exécutent au maximum 10 étapes avant de nécessiter une intervention humaine. - 47 % complètent moins de 5 étapes. - 70 % s'appuient sur des modèles préexistants sans aucun ajustement. - 74 % dépendent principalement de l'évaluation humaine. Les équipes échangent intentionnellement autonomie contre fiabilité. Pourquoi ces contraintes ? La fiabilité reste le principal défi non résolu. Les praticiens ne peuvent pas vérifier la justesse des agents à grande échelle. Les benchmarks publics s'appliquent rarement aux tâches de production spécifiques au domaine. 75 % des équipes interrogées évaluent sans benchmarks formels, s'appuyant plutôt sur des tests A/B et des retours directs des utilisateurs. 2) Sélection de Modèle Le modèle de sélection a surpris les chercheurs. 17 des 20 études de cas utilisent des modèles de pointe à code fermé comme Claude Sonnet 4, Claude Opus 4.1 et GPT o3. L'adoption de l'open-source est rare et motivée par des contraintes spécifiques : des charges de travail à volume élevé où les coûts d'inférence deviennent prohibitifs, ou des exigences réglementaires empêchant le partage de données avec des fournisseurs externes. Pour la plupart des équipes, les coûts d'exécution sont négligeables par rapport aux experts humains que l'agent complète. 3) Cadres d'Agents L'adoption de cadres montre une divergence frappante. 61 % des répondants à l'enquête utilisent des cadres tiers comme LangChain/LangGraph. Mais 85 % des équipes interrogées ayant des déploiements en production construisent des implémentations personnalisées à partir de zéro. La raison : les boucles d'agent de base sont simples à mettre en œuvre avec des appels API directs. Les équipes préfèrent des structures minimales, conçues sur mesure, plutôt que des dépendances encombrantes et des couches d'abstraction. 4) Flux de Contrôle des Agents Les architectures de production favorisent des flux de travail statiques prédéfinis plutôt qu'une autonomie ouverte. 80 % des études de cas utilisent un flux de contrôle structuré. Les agents opèrent dans des espaces d'action bien définis plutôt que d'explorer librement les environnements. Une seule étude a permis une exploration sans contrainte, et ce système fonctionne exclusivement dans des environnements isolés avec une vérification CI/CD rigoureuse....