Acabo de tener el placer de leer un ensayo realmente brillante de @tainab. Hace un punto increíblemente sencillo (aunque lo envuelve en un poco de teoría social que se puede tomar o dejar según su preferencia): hay una forma muy básica en la que se entrenan los modelos de base de datos en
Sesgados: sobremuestrean la locuacidad de la misma manera que mirar a las empresas en la S y P 500 hoy crea sesgo de supervivencia en análisis técnico retrospectivo o (irónicamente) hay un sesgo antrópico al pensar en mundos posibles. Muestreo basado en tokens v
Basado en las respuestas de la gente sobre las muestras de los locuazes.
La mayoría de la gente suele generar muy pocos tokens.
1.88K