الجزء المجنون هو أن عدم التفكير في Opus 4.1 يكاد يكون جيدا مثل GPT-5-high ، وأحيانا أفضل في بعض الجوانب ، إلا أنه يبدأ في الإجابة على الفور بدلا من التفكير لمدة دقيقة كاملة. لا أفهم كيف تمكنت Anthropic من جعل النسخة غير المنطقية ذكية للغاية
lmarena.ai
lmarena.ai‏12 أغسطس، 00:57
🚨 تحديث لوحة المتصدرين: يصعد Claude Opus 4.1 إلى # 2 بشكل عام في Arena وأصبح الآن أفضل نموذج غير مفكر ، حيث يطابق GPT-5 في # 1 عبر الفئات الرئيسية: -الترميز - التعليمات التالية - مطالبات صعبة - استعلامات أطول تهانينا ل @AnthropicAI على هذا الإنجاز المثير للإعجاب!
‏‎138.33‏K