這裡有重大的突破! 終於,你的代理可以像人類一樣學習: 代理強化訓練器(ART)是一個框架,用於訓練多步驟的 LLM 代理,以執行現實世界的任務,使用 GRPO。 你只需要幾行代碼。不需要手動獎勵! 100% 開源。