非常識なのは、Opus 4.1 の非思考は GPT-5 ハイとほぼ同じくらい優れており、1 分間考えるのではなく即座に応答し始めることを除けば、いくつかの点で優れている場合もあります。Anthropicがどのようにして非理性的なバージョンをこれほどスマートにすることができたのか理解できません
lmarena.ai
lmarena.ai8月12日 00:57
🚨 リーダーボードの更新: Claude Opus 4.1は、アリーナ全体で#2に上昇し、現在、主要なカテゴリでGPT-5に匹敵する、最高の非思考モデルとなっています。 -コーディング - 指示に従う - ハードプロンプト - より長いクエリ この素晴らしいマイルストーンの達成@AnthropicAIおめでとうございます!
138.31K