Een grappig aspect van reinforcement learning is dat het moeilijk is om bugs te vinden, omdat de onderliggende leerbenadering zo krachtig is dat het meestal wel werkt, zelfs als belangrijke elementen kapot zijn.