PANews raportoi 12. syyskuuta, että Alibaban Tongyi Qianwen julkaisi seuraavan sukupolven infrastruktuurin Qwen3-Next ja avoimen lähdekoodin Qwen3-Next-80B-A3B-sarjan mallit, jotka perustuvat tähän arkkitehtuuriin. Verrattuna Qwen3:n MoE-mallirakenteeseen, rakenteessa on seuraavat keskeiset parannukset: sekahuomiomekanismi, erittäin harva MoE-rakenne, sarja vakaita ja ystävällisiä optimointeja harjoitteluun sekä usean tokenin ennustusmekanismi päättelytehokkuuden parantamiseksi. Qwen3-Nextin mallirakenteen perusteella Alibaba koulutti Qwen3-Next-80B-A3B-Base-mallin, jossa on 80 miljardia parametria ja joka aktivoi vain 3 miljardia parametria. Perusmalli saavuttaa samanlaisen tai jopa hieman paremman suorituskyvyn kuin tiheä Qwen3-32B-malli, ja sen koulutuskustannukset (GPU-tunnit) ovat alle kymmenesosa Qwen3-32B:n kustannuksista, ja päättelyn suorituskyky yli 32k:n kontekstissa on yli kymmenkertainen Qwen3-32B:hen verrattuna, mikä saavuttaa äärimmäisen koulutus- ja päättelykustannustehokkuuden.