关于内在与外在AI动机的辩论已经结束。 Meta刚刚展示了整个显性奖励系统只是一个干扰。 你每月500美元的强化学习平台现在正在教导带有辅助轮的智能体。 真正的学习来自于直接的后果,而不是任意的分数。 这为真正自适应、未编程的智能铺平了道路。