Posuvné okno Attention (SWA) pohání hraniční hybridní modely pro zvýšení hospodárnosti. Je něco lepšího? Představujeme Phalanx, rychlejší a kvalitnější náhradu posuvných okenních pozorností (SWA). Phalanx je nová rodina hardwarových a numerických okenních vrstev navržených se zaměřením na datovou lokalitu a zubatá, blokově zarovnaná okna, která se mapují přímo na GPU. V rámci školení poskytuje Phalanx o 10–40 % vyšší end-to-end propustnost při délkách kontextu 4K–32K oproti optimalizovaným hybridům SWA a transformátorům tím, že snižuje nákladnou komunikaci mezi warpy. Dnes vydáváme technickou zprávu, blog a jádra Phalanx v naší knihovně výzkumných jader spear. Přijímáme nové zaměstnance.