¡Nueva publicación de blog! Acelerar los LLM utilizando mecanismos de atención lineal. Explicación matemática y compensaciones.