瘋狂的部分是,Opus 4.1 的非思考模式幾乎和 GPT-5 高級版一樣好,有時在某些方面甚至更好,只是它開始回答時是瞬間反應,而不是思考整整一分鐘。我不明白 Anthropic 是怎麼讓非推理版本變得如此聰明的。
lmarena.ai
lmarena.ai8月12日 00:57
🚨 排行榜更新: Claude Opus 4.1 爬升至 Arena 總排名第 #2,現在成為最佳非思考模型,與 GPT-5 在關鍵類別中並列第 #1: - 編碼 - 指令跟隨 - 難題 - 較長查詢 恭喜 @AnthropicAI 達成這一令人印象深刻的里程碑!
138.31K