Đột phá lớn ở đây! Cuối cùng, các tác nhân của bạn có thể học như con người: Agent Reinforcement Trainer (ART) là một khung để đào tạo các tác nhân LLM đa bước cho các nhiệm vụ thực tế bằng cách sử dụng GRPO. Bạn chỉ cần một vài dòng mã. Không cần phần thưởng thủ công! 100% mã nguồn mở.