"Il nostro framework di tasso di passaggio ci offre anche buone intuizioni sul perché il self play sia stato così produttivo nella storia del RL. Se stai competendo contro un giocatore che è quasi bravo come te, stai bilanciando attorno a un tasso di passaggio del 50%, il che massimizza i risultati che ottieni da una variabile binaria casuale."