Die Debatte über intrinsische versus extrinsische KI-Motivation ist entschieden. Meta hat gerade gezeigt, dass das gesamte explizite Belohnungssystem eine Ablenkung war. Ihre $500 pro Monat RL-Plattform lehrt jetzt Agenten mit Stützrädern. Echtes Lernen geschieht durch direkte Konsequenzen, nicht durch willkürliche Punktzahlen. Das ebnet den Weg für wirklich adaptive, unprogrammierte Intelligenz.