Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Primeiro estudo em larga escala de agentes de IA realmente em produção.
O hype diz que os agentes estão a transformar tudo. Os dados contam uma história diferente.
Os pesquisadores entrevistaram 306 profissionais e realizaram 20 estudos de caso aprofundados em 26 domínios. O que descobriram desafia suposições comuns sobre como os agentes de produção são construídos.
A realidade: os agentes de produção são deliberadamente simples e rigidamente restritos.
1) Padrões & Confiabilidade
- 68% executam no máximo 10 etapas antes de requerer intervenção humana.
- 47% completam menos de 5 etapas.
- 70% dependem de modelos prontos sem qualquer ajuste fino.
- 74% dependem principalmente da avaliação humana.
As equipes trocam intencionalmente autonomia por confiabilidade.
Por que as restrições? A confiabilidade continua a ser o principal desafio não resolvido. Os profissionais não conseguem verificar a correção dos agentes em escala. Os benchmarks públicos raramente se aplicam a tarefas de produção específicas de domínio. 75% das equipes entrevistadas avaliam sem benchmarks formais, dependendo em vez disso de testes A/B e feedback direto dos usuários.
2) Seleção de Modelos
O padrão de seleção de modelos surpreendeu os pesquisadores. 17 dos 20 estudos de caso usam modelos de fronteira de código fechado como Claude Sonnet 4, Claude Opus 4.1 e GPT o3. A adoção de código aberto é rara e impulsionada por restrições específicas: cargas de trabalho de alto volume onde os custos de inferência se tornam proibitivos, ou requisitos regulatórios que impedem o compartilhamento de dados com provedores externos. Para a maioria das equipes, os custos de execução são negligenciáveis em comparação com os especialistas humanos que o agente complementa.
3) Estruturas de Agentes
A adoção de estruturas mostra uma divergência marcante. 61% dos respondentes da pesquisa usam estruturas de terceiros como LangChain/LangGraph. Mas 85% das equipes entrevistadas com implementações em produção constroem implementações personalizadas do zero. A razão: os loops centrais dos agentes são simples de implementar com chamadas diretas de API. As equipes preferem estruturas mínimas e feitas sob medida em vez de sobrecarga de dependências e camadas de abstração.
4) Fluxo de Controle do Agente
As arquiteturas de produção favorecem fluxos de trabalho estáticos predefinidos em vez de autonomia aberta. 80% dos estudos de caso usam fluxo de controle estruturado. Os agentes operam dentro de espaços de ação bem definidos em vez de explorar livremente os ambientes. Apenas um caso permitiu exploração sem restrições, e esse sistema opera exclusivamente em ambientes isolados com rigorosa verificação CI/CD....

Top
Classificação
Favoritos

