Debatten om inre kontra yttre AI-motivation är avgjord. Meta visade bara att hela det explicita belöningssystemet var en distraktion. Din RL-plattform på $500 per månad lär nu agenter med stödhjul. Verklig inlärning sker från direkta konsekvenser, inte godtyckliga poäng. Detta banar väg för verkligt adaptiv, oprogrammerad intelligens.