المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 يتفوق على GPT 5 في اختبار التفكير المعقد
في أحدث معيار ARC AGI 2 ، سجل Grok 4 حوالي 16٪ متفوقا على 9.9٪ من GPT 5 ولكن بسعر أعلى من 2 دولار إلى 4 دولارات لكل مهمة مقارنة ب 0.73 دولار في GPT 5.
يقيس الاختبار التفكير في الحفظ ، وقاد Grok 4 أيضا ARC AGI 1 بنسبة 68٪ مقابل 65.7٪ ل GPT 5. لا يزال GPT 5 يقدم قيمة أفضل في الوقت الحالي.
سجلت إصدارات النماذج الأصغر درجات أقل بكثير ، وتجري التجارب المبكرة لاختبار ألغاز ARC AGI 3 التفاعلي.
يعزز هذا الفوز Grok 4 لكن سباق الذكاء الاصطناعي لم ينته بعد.
المصدر: وحدة فك التشفير ، @minchoi
42.55K
الأفضل
المُتصدِّرة
التطبيقات المفضلة