O nouă postare pe blog! Accelerarea LLM-urilor folosind mecanisme de atenție liniară. Explicații matematice și compromisuri.