De fleste VLM-benchmarks følger verden; Få spør hvordan handlinger *endrer* det fra en robots øye. Kroppslig kognisjon forteller oss at intelligens ikke bare er å observere – den utøves gjennom interaksjon. 👉Vi introduserer ENACT: En benchmark som tester om VLM-er kan spore utviklingen av et hjemmemiljø i stor skala fra en robots egosentriske perspektiv. 🌐 📄 1/N