Como demuestra el aterrador nuevo artículo de PNAS de @seanjwestwood, los LLM ahora pueden pasar casi todas las pruebas de atención, reflejar personalidades, mantenerse consistentes a lo largo de las páginas y sesgar sistemáticamente las respuestas en el agregado. Así que aquí hay un ángulo diferente: verificar la presencia física, no el texto.