關於內在與外在 AI 動機的辯論已經結束。 Meta 剛剛顯示整個明確的獎勵系統只是一種干擾。 你每月 500 美元的強化學習平台現在正在教導帶有輔助輪的代理。 真正的學習來自於直接的後果,而不是任意的分數。 這為真正自適應、未編程的智慧鋪平了道路。