El debate sobre la motivación intrínseca frente a la extrínseca de la IA está resuelto. Meta acaba de demostrar que todo el sistema de recompensas explícitas era una distracción. Tu plataforma de RL de $500 al mes ahora está enseñando a los agentes con ruedas de entrenamiento. El aprendizaje real ocurre a partir de consecuencias directas, no de puntuaciones arbitrarias. Esto allana el camino para una inteligencia verdaderamente adaptativa y no programada.