Primul studiu la scară largă asupra agenților AI care rulează efectiv în producție. Entuziasmul spune că agenții transformă totul. Datele spun o altă poveste. Cercetătorii au chestionat 306 practicieni și au realizat 20 de studii de caz aprofundate în 26 de domenii. Ceea ce au găsit ei contestă presupunerile comune despre modul în care sunt construiți agenții de producție. Realitatea: agenții de producție sunt deliberat simpli și strict constrânși. 1) Modele și Fiabilitate - 68% execută cel mult 10 pași înainte de a necesita intervenția umană. - 47% finalizează mai puțin de 5 pași. - 70% se bazează pe modele gata de vânzare fără nicio ajustare fină. - 74% depind în principal de evaluarea umană. Echipele schimbă intenționat autonomia pentru fiabilitate. De ce aceste constrângeri? Fiabilitatea rămâne principala provocare nerezolvată. Practicienii nu pot verifica corectitudinea agentului la scară largă. Benchmark-urile publice se aplică rareori sarcinilor de producție specifice domeniului. 75% dintre echipele intervievate evaluează fără repere formale, bazându-se pe testarea A/B și feedback-ul direct al utilizatorilor. 2) Selecția modelului Modelul de selecție a modelului i-a surprins pe cercetători. 17 din 20 de studii de caz folosesc modele frontieră închise precum Claude Sonnet 4, Claude Opus 4.1 și GPT o3. Adoptarea open-source este rară și determinată de constrângeri specifice: sarcini de lucru cu volum mare unde costurile de inferență devin prohibitive sau cerințe de reglementare care împiedică partajarea datelor cu furnizori externi. Pentru majoritatea echipelor, costurile de rulare sunt neglijabile comparativ cu experții umani pe care îi suplimentează agentul. 3) Cadre de agenți Adoptarea cadrului arată o divergență izbitoare. 61% dintre respondenți la sondaj folosesc cadre terțe precum LangChain/LangGraph. Dar 85% dintre echipele intervievate cu implementări în producție construiesc implementări personalizate de la zero. Motivul: buclele de agenți de bază sunt ușor de implementat cu apeluri API directe. Echipele preferă schelele minimaliste, construite special special, în locul umflării dependențelor și straturilor de abstractizare. 4) Fluxul de control al agentului Arhitecturile de producție favorizează fluxuri de lucru statice predefinite în locul autonomiei deschise. 80% dintre studiile de caz folosesc un flux de control structurat. Agenții operează în spații de acțiune bine definite, nu să exploreze liber mediile. Doar un singur caz permitea explorarea neconstrânsă, iar acel sistem rulează exclusiv în medii sandbox, cu verificare riguroasă CI/CD....