Una cosa curiosa sobre el aprendizaje por refuerzo es que es difícil encontrar errores, porque el enfoque de aprendizaje subyacente es tan poderoso que tiende a funcionar de todos modos, incluso si se rompen elementos importantes.