En av de satsningar jag gör är att "lära sig miljön" kommer att ge mitt team möjlighet att lära sig policyer som utnyttjar vår världs fysik
I princip ersätter man fysiken med ett neuralt nätverk
Tyvärr kommer det att ta för mycket tid, så vår egen fysiksimulator får duga. Jag ska tillbringa helgen med att fundera på hur jag ska passa in saker, på vilken nivå jag ska klippa den. Till exempel, vilken del av min simulator ersätts av det neurala nätverket?
Jag tror att det jag verkligen vill göra är att skapa ett fysiskt rum med kuddväggar och ha en massa robotar uppradade för utplacering som enkelt kan återhämta sig själva, och låta dem röra sig hela natten och samla data och hitta situationer de inte kan förutse
6,09K