Nowy post na blogu! Przyspieszanie LLM-ów za pomocą mechanizmów uwagi liniowej. Wyjaśnienie matematyczne i kompromisy.