Новая запись в блоге! Ускорение LLM с использованием линейных механизмов внимания. Математическое объяснение и компромиссы.