Vårt senaste arbete som benchmarkar modern VLM och deras effektivitet för långsiktiga hushållsaktiviteter i robotinlärning, med hjälp av BEHAVIOR-benchmarkmiljön. 👇