Debata o vnitřní versus vnější motivaci umělé inteligence je vyřešena. Meta právě ukázala, že celý explicitní systém odměn odvádí pozornost. Vaše platforma RL za 500 $ měsíčně nyní učí agenty s tréninkovými kolečky. Skutečné učení se děje z přímých důsledků, nikoli z libovolných výsledků. To dláždí cestu pro skutečně adaptivní, nenaprogramovanou inteligenci.