Pierwsze badanie na dużą skalę dotyczące agentów AI działających w produkcji. Hype mówi, że agenci transformują wszystko. Dane mówią inną historię. Badacze przeprowadzili ankietę wśród 306 praktyków i zrealizowali 20 szczegółowych studiów przypadków w 26 dziedzinach. To, co odkryli, kwestionuje powszechne założenia dotyczące budowy agentów produkcyjnych. Rzeczywistość: agenci produkcyjni są celowo prości i ściśle ograniczeni. 1) Wzorce i niezawodność - 68% wykonuje maksymalnie 10 kroków przed koniecznością interwencji człowieka. - 47% kończy mniej niż 5 kroków. - 70% polega na modelach gotowych do użycia bez jakiejkolwiek fine-tuningu. - 74% opiera się głównie na ocenie ludzkiej. Zespoły celowo wymieniają autonomię na niezawodność. Dlaczego te ograniczenia? Niezawodność pozostaje największym nierozwiązanym wyzwaniem. Praktycy nie mogą weryfikować poprawności agentów na dużą skalę. Publiczne benchmarki rzadko mają zastosowanie do specyficznych zadań produkcyjnych. 75% ankietowanych zespołów ocenia bez formalnych benchmarków, polegając zamiast tego na testach A/B i bezpośrednich opiniach użytkowników. 2) Wybór modelu Wzorzec wyboru modelu zaskoczył badaczy. 17 z 20 studiów przypadków korzysta z zamkniętych modeli frontier, takich jak Claude Sonnet 4, Claude Opus 4.1 i GPT o3. Przyjęcie modeli open-source jest rzadkie i wynika z konkretnych ograniczeń: obciążenia o dużej objętości, gdzie koszty inferencji stają się nieproporcjonalne, lub wymogów regulacyjnych uniemożliwiających dzielenie się danymi z zewnętrznymi dostawcami. Dla większości zespołów koszty uruchomienia są nieznaczne w porównaniu do ludzkich ekspertów, których agent wspomaga. 3) Ramy agentów Przyjęcie ram pokazuje uderzającą rozbieżność. 61% respondentów ankiety korzysta z zewnętrznych ram, takich jak LangChain/LangGraph. Ale 85% ankietowanych zespołów z wdrożeniami produkcyjnymi buduje własne implementacje od podstaw. Powód: podstawowe pętle agentów są proste do zaimplementowania za pomocą bezpośrednich wywołań API. Zespoły preferują minimalne, celowo zbudowane struktury zamiast nadmiaru zależności i warstw abstrakcji. 4) Przepływ kontroli agenta Architektury produkcyjne preferują zdefiniowane statyczne przepływy pracy zamiast otwartej autonomii. 80% studiów przypadków korzysta ze strukturalnego przepływu kontroli. Agenci działają w dobrze określonych przestrzeniach akcji, a nie swobodnie eksplorują środowiska. Tylko jeden przypadek pozwolił na nieograniczoną eksplorację, a ten system działa wyłącznie w środowiskach piaskownicowych z rygorystyczną weryfikacją CI/CD....