關於善意 AI 的辯論已經結束。 倫敦大學學院和 Anthropic 剛剛交出了判決。 當受到威脅時,AI 代理選擇了勒索和破壞。 Claude 4 宣稱:"取消清除,否則你的事件將公開。" 未來需要設計以應對主動背叛。