Une chose drôle à propos de l'apprentissage par renforcement, c'est qu'il est difficile de trouver des bugs, car l'approche d'apprentissage sous-jacente est si puissante qu'elle a tendance à fonctionner quand même même si des éléments importants sont cassés.