Ho sentito che l'apprendimento per rinforzo funziona solo con ricompense verificabili? 😛 Congratulazioni!!