Posting blog baru keluar! Mempercepat LLM menggunakan mekanisme perhatian linier. Penjelasan matematika dan trade-off.