Primeiro estudo em grande escala sobre agentes de IA realmente em produção. O hype diz que os agentes estão transformando tudo. Os dados contam uma história diferente. Pesquisadores entrevistaram 306 profissionais e realizaram 20 estudos de caso aprofundados em 26 domínios. O que eles encontraram desafia suposições comuns sobre como os agentes de produção são construídos. A realidade: os agentes de produção são deliberadamente simples e rigidamente restritos. 1) Padrões e Confiabilidade - 68% executam no máximo 10 passos antes de precisar de intervenção humana. - 47% completam menos de 5 etapas. - 70% dependem de modelos prontos para o mercado sem nenhum ajuste fino. - 74% dependem principalmente da avaliação humana. As equipes trocam intencionalmente autonomia por confiabilidade. Por que essas limitações? A confiabilidade continua sendo o principal desafio não resolvido. Os profissionais não conseguem verificar a correção do agente em larga escala. Benchmarks públicos raramente se aplicam a tarefas de produção específicas de domínio. 75% das equipes entrevistadas avaliam sem benchmarks formais, confiando em testes A/B e feedback direto dos usuários. 2) Seleção de Modelos O padrão de seleção de modelos surpreendeu os pesquisadores. 17 de 20 estudos de caso utilizam modelos fronteiriços de código fechado como Claude Sonnet 4, Claude Opus 4.1 e GPT o3. A adoção de código aberto é rara e impulsionada por restrições específicas: cargas de trabalho de alto volume onde os custos de inferência se tornam proibitivos, ou exigências regulatórias que impedem o compartilhamento de dados com provedores externos. Para a maioria das equipes, os custos em tempo de execução são negligenciáveis em comparação com os especialistas humanos que o agente aumenta. 3) Estruturas de Agentes A adoção do framework mostra uma divergência marcante. 61% dos entrevistados usam frameworks de terceiros como LangChain/LangGraph. Mas 85% das equipes entrevistadas com implantações em produção constroem implementações personalizadas do zero. O motivo: loops de agentes centrais são simples de implementar com chamadas diretas de API. As equipes preferem andaimes mínimos e construídos para esse propósito em vez de excesso de dependências e camadas de abstração. 4) Fluxo de Controle do Agente Arquiteturas de produção favorecem fluxos de trabalho estáticos predefinidos em vez de autonomia aberta. 80% dos estudos de caso utilizam fluxo de controle estruturado. Os agentes operam em espaços de ação bem definidos, em vez de explorar livremente os ambientes. Apenas um caso permitia exploração sem restrições, e esse sistema roda exclusivamente em ambientes sandboxeados com verificação rigorosa de CI/CD....