¡Nuevo post en el blog! Acelerando LLMs utilizando mecanismos de atención lineales. Explicación matemática y compensaciones.