Огромный прорыв здесь! Наконец, ваши агенты могут учиться как люди: Agent Reinforcement Trainer (ART) — это фреймворк для обучения многошаговых LLM-агентов для выполнения реальных задач с использованием GRPO. Вам нужно всего лишь несколько строк кода. Никакие ручные вознаграждения не нужны! 100% с открытым исходным кодом.