¡Gran avance aquí! Finalmente, tus agentes pueden aprender como humanos: Agent Reinforcement Trainer (ART) es un marco para entrenar agentes LLM de múltiples pasos para tareas del mundo real utilizando GRPO. Solo necesitas unas pocas líneas de código. ¡No se necesitan recompensas manuales! 100% de código abierto.