Una cosa divertente riguardo all'apprendimento per rinforzo è che è difficile trovare bug, perché l'approccio di apprendimento sottostante è così potente che tende a funzionare comunque anche se elementi importanti sono rotti.