En rolig sak med förstärkningsinlärning är att det är svårt att hitta buggar, eftersom den underliggande inlärningsmetoden är så kraftfull att den tenderar att fungera ändå även om viktiga element är trasiga.