🚨 排行榜更新: Claude Opus 4.1 在竞技场中攀升至第2名,现已成为最佳非思考模型,在关键类别中与第1名的GPT-5并驾齐驱: - 编码 - 指令跟随 - 难题 - 较长查询 恭喜 @AnthropicAI 达成这一令人印象深刻的里程碑!
Anthropic
Anthropic8月6日 00:27
今天我们发布了Claude Opus 4.1,这是对Claude Opus 4在代理任务、现实世界编码和推理方面的升级。
Claude Opus 4.1 的思维版本正在 Arena 中进行测试。结果即将公布。 在以下网址测试 Claude Opus 4.1 及其他最佳 AI 模型:
287.86K