🧪 Nueva entrega de cuadernos: ¡Evaluando LLMs por salidas dañinas! ¿Qué modelos son realmente seguros para producción? Construimos un pipeline LLM-como-Juez utilizando la API de Together Evals para comparar modelos en cuanto a su peligrosidad. Código👇
1,71K