🧪 Nowy Zrzut Notatnika: Ocena LLM-ów pod kątem szkodliwych wyników! Które modele są naprawdę bezpieczne do produkcji? Stworzyliśmy pipeline LLM-as-a-Judge używając API Together Evals, aby porównać modele pod kątem szkodliwości. Kod👇
1,69K