仅需一行 Python 代码即可训练 AI 代理以完成复杂的现实世界任务。 代理强化训练器使用 LLM 作为评判者来训练多步骤代理,无需手动奖励。 100% 开源。