O debate sobre a motivação intrínseca versus extrínseca da IA está resolvido. A Meta acabou de mostrar que todo o sistema de recompensas explícitas era uma distração. A sua plataforma de RL de $500 por mês agora está a ensinar agentes com rodinhas de treino. O verdadeiro aprendizado acontece a partir de consequências diretas, não de pontuações arbitrárias. Isto abre caminho para uma inteligência verdadeiramente adaptativa e não programada.