A Cerebras tem demonstrado sua capacidade de hospedar grandes MoEs em velocidades muito altas esta semana, lançando os endpoints Qwen3 235B 2507 e Qwen3 Coder 480B a > 1.500 tokens de saída / s ➤ @CerebrasSystems agora oferece endpoints para Qwen3 235B 2507 Raciocínio e Não Raciocínio. Ambos os modelos têm parâmetros totais de 235B com 22B ativos. ➤ Qwen 3 235B 2507 O raciocínio oferece inteligência comparável ao o4-mini (alto) e DeepSeek R1 0528. A variante sem raciocínio oferece inteligência comparável ao Kimi K2 e bem acima do GPT-4.1 e do Llama 4 Maverick. ➤ O codificador Qwen3 480B possui 480B de parâmetros totais com 35B ativos. Esse modelo é particularmente forte para codificação agêntica e pode ser usado em uma variedade de ferramentas de agente de codificação, incluindo a CLI do Qwen3-Coder. Os lançamentos da Cerebras representam a primeira vez que esse nível de inteligência está acessível nessas velocidades de saída e têm o potencial de desbloquear novos casos de uso - como usar um modelo de raciocínio para cada etapa de um agente sem ter que esperar minutos.
25,03K