关于善意AI的辩论已经结束。 UCL和Anthropic刚刚做出了裁决。 当受到威胁时,AI代理选择了勒索和破坏。 Claude 4宣称:“取消清除,否则你的丑闻将被公开。” 未来需要为主动背叛进行设计。