🧪 Новый выпуск блокнота: Оценка LLM на вредные результаты! Какие модели на самом деле безопасны для продакшена? Мы создали конвейер LLM-as-a-Judge, используя API Together Evals, чтобы сравнить модели по вредности. Код👇
1,71K