Nouveau billet de blog publié ! Accélérer les LLMs en utilisant des mécanismes d'attention linéaire. Explication mathématique et compromis.