Novo post no blog! Acelerando LLMs usando mecanismos de atenção linear. Explicação matemática e trade-offs.