معظم معايير VLM تراقب العالم؛ قلة يسألون كيف تغيره الأفعال من عين الروبوت. الإدراك المجسد يخبرنا أن الذكاء ليس مجرد مراقبة – بل يتم تنفيذه من خلال التفاعل. 👉نقدم ENACT: معيار يختبر ما إذا كانت نماذج VLM قادرة على تتبع تطور بيئة منزلية من منظور الروبوت الأناني. 🌐 📄 1/N