Nieuwe blogpost gepubliceerd! Versnellen van LLM's met behulp van lineaire aandachtmechanismen. Wiskundige uitleg en afwegingen.