一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

在我看来，SWE-bench 和 T-bench 是少数几个在我们模型进展方面有良好信号的基准。这款模型的表现与 Qwen3 Coder 相当，仅比 GPT-5 差 10%，同时它还是一款通用的 LLM，而不是专门针对代码的。

28.53K