一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

Cerebras 本周展示了其以非常高的速度托管大型 MoE 的能力，推出了 Qwen3 235B 2507 和 Qwen3 Coder 480B 端点，输出速度超过 1,500 个 token/s ➤ @CerebrasSystems 现在提供 Qwen3 235B 2507 推理和非推理的端点。这两个模型的总参数为 235B，活跃参数为 22B。 ➤ Qwen 3 235B 2507 推理提供的智能可与 o4-mini（高）和 DeepSeek R1 0528 相媲美。非推理变体的智能可与 Kimi K2 相媲美，远超 GPT-4.1 和 Llama 4 Maverick。 ➤ Qwen3 Coder 480B 的总参数为 480B，活跃参数为 35B。该模型在代理编码方面特别强大，可以用于多种编码代理工具，包括 Qwen3-Coder CLI。 Cerebras 的发布代表了这一智能水平首次以这些输出速度可用，并有潜力解锁新的用例——例如，在不必等待几分钟的情况下，为每个代理步骤使用推理模型。

25.03K