أحد الرهانات التي أضعها هو أن "تعلم البيئة" سيمنح فريقي القدرة على تعلم السياسات التي تستغل فيزياء عالمنا
ببساطة، استبدال الفيزياء بشبكة عصبية
للأسف، هذا سيكلف وقتا طويلا، لذا سيضطر محاكي الفيزياء الخاص بنا أن يكفي. سأقضي هذا الأسبوع أفكر في كيفية تركيب الأشياء، وعلى أي مستوى أقصها. مثلا، أي جزء من المحاكي يتم استبداله بالشبكة العصبية؟
أعتقد أن ما أريده حقا هو إنشاء غرفة فعلية بجدران وسائد ووضع مجموعة من الروبوتات مصطفة للنشر يمكنها استعادة نفسها بسهولة، وتركها تتنقل طوال الليل تجمع البيانات وتجد المواقف التي لا يمكنهم التنبؤ بها
‏‎5.72‏K