🧪 Новий Notebook Drop: оцінка LLM на шкідливі виходи! Які моделі насправді безпечні для проду? Ми побудували пайплайн LLM-as-a-Judge, використовуючи API Together Evals для порівняння моделей за шкідливістю. Код👇
1,69K