Cerebras ha dimostrato la sua capacità di ospitare grandi MoE a velocità molto elevate questa settimana, lanciando gli endpoint Qwen3 235B 2507 e Qwen3 Coder 480B a >1.500 token di output/s ➤ @CerebrasSystems ora offre endpoint sia per Qwen3 235B 2507 Reasoning che Non-reasoning. Entrambi i modelli hanno 235B parametri totali con 22B attivi. ➤ Qwen 3 235B 2507 Reasoning offre un'intelligenza comparabile a o4-mini (alta) e DeepSeek R1 0528. La variante Non-reasoning offre un'intelligenza comparabile a Kimi K2 e ben superiore a GPT-4.1 e Llama 4 Maverick. ➤ Qwen3 Coder 480B ha 480B parametri totali con 35B attivi. Questo modello è particolarmente forte per la codifica agentica e può essere utilizzato in una varietà di strumenti per agenti di codifica, incluso il Qwen3-Coder CLI. I lanci di Cerebras rappresentano la prima volta che questo livello di intelligenza è stato accessibile a queste velocità di output e hanno il potenziale di sbloccare nuovi casi d'uso - come utilizzare un modello di ragionamento per ogni passo di un agente senza dover aspettare minuti.
25,02K