Nytt blogginlägg ute! Snabba LLM:er med hjälp av linjära uppmärksamhetsmekanismer. Matematisk förklaring och kompromisser.