Il dibattito tra motivazione intrinseca ed estrinseca dell'AI è risolto. Meta ha appena dimostrato che l'intero sistema di ricompensa esplicita era una distrazione. La tua piattaforma RL da $500 al mese sta ora insegnando agli agenti con le rotelle. Il vero apprendimento avviene dalle conseguenze dirette, non da punteggi arbitrari. Questo apre la strada a un'intelligenza veramente adattiva e non programmata.