Um avanço enorme aqui! Por fim, seus agentes podem aprender como humanos: Agent Reinforcement Trainer (ART) é um framework para treinar agentes LLM em múltiplas etapas para tarefas do mundo real usando GRPO. Você só precisa de algumas linhas de código. Não é necessário recompensar manualmente! 100% open-source.