🧪 إسقاط دفتر ملاحظات جديد: تقييم LLMs للمخرجات الضارة! ما هي النماذج الآمنة بالفعل للإنتاج؟ لقد أنشأنا خط أنابيب LLM-as-a-Judge باستخدام واجهة برمجة تطبيقات Together Evals لمقارنة النماذج على الضرر. رمز👇
‏‎1.7‏K