Обучайте AI-агентов для сложных задач в реальном мире всего одной строкой кода на Python. Тренер по усилению агентов использует LLM-as-judge для обучения многошаговых агентов без ручных вознаграждений. 100% с открытым исходным кодом.