Neuer Blogbeitrag veröffentlicht! LLMs mit linearen Aufmerksamkeitsmechanismen beschleunigen. Mathematische Erklärung und Abwägungen.