Cerebras 本周展示了其以非常高的速度托管大型 MoE 的能力,推出了 Qwen3 235B 2507 和 Qwen3 Coder 480B 端点,输出速度超过 1,500 个 token/s ➤ @CerebrasSystems 现在提供 Qwen3 235B 2507 推理和非推理的端点。这两个模型的总参数为 235B,活跃参数为 22B。 ➤ Qwen 3 235B 2507 推理提供的智能可与 o4-mini(高)和 DeepSeek R1 0528 相媲美。非推理变体的智能可与 Kimi K2 相媲美,远超 GPT-4.1 和 Llama 4 Maverick。 ➤ Qwen3 Coder 480B 的总参数为 480B,活跃参数为 35B。该模型在代理编码方面特别强大,可以用于多种编码代理工具,包括 Qwen3-Coder CLI。 Cerebras 的发布代表了这一智能水平首次以这些输出速度可用,并有潜力解锁新的用例——例如,在不必等待几分钟的情况下,为每个代理步骤使用推理模型。
25.03K