El debate sobre la motivación intrínseca versus la motivación extrínseca de la IA está resuelto. Meta acaba de demostrar que todo el sistema de recompensas explícito era una distracción. Su plataforma RL de $ 500 por mes ahora está enseñando a los agentes con ruedas de entrenamiento. El aprendizaje real ocurre a partir de consecuencias directas, no de puntajes arbitrarios. Esto allana el camino para una inteligencia verdaderamente adaptativa y no programada.