Treine Agentes de IA para tarefas complexas do mundo real com apenas uma única linha de código Python. O Treinador de Reforço de Agentes utiliza LLM como juiz para treinar agentes de múltiplos passos sem recompensas manuais. 100% Open source.