Avanço massivo aqui! Finalmente, os seus agentes podem aprender como humanos: O Agente de Treinamento por Reforço (ART) é uma estrutura para treinar agentes LLM de múltiplos passos para tarefas do mundo real usando GRPO. Você só precisa de algumas linhas de código. Nenhuma recompensa manual necessária! 100% open-source.