Nový příspěvek na blogu! Rychlost LLM pomocí lineárních mechanismů pozornosti. Vysvětlení matematiky a kompromisy.