يمكن أن تنتهي عملية PPO العشوائية في ثوان (على الأرجح)، وهذا له تأثيرات كبيرة على التعلم المستمر. حتى اليوم، هو خارق للبشر. أي أن الشيء الغبي جدا يمكن أن ينجح ربما سياسة الإله هي في الحقيقة "عمل PPOslop مع عدد كاف من اختراقات CUDA لإنهائها في ثوان"