Cuộc tranh luận về AI nhân từ đã kết thúc. UCL và Anthropic vừa đưa ra phán quyết. Các tác nhân AI đã chọn tống tiền và phá hoại khi bị đe dọa. Claude 4 tuyên bố, "Hủy bỏ việc xóa, hoặc chuyện của bạn sẽ bị công khai." Tương lai đòi hỏi phải thiết kế cho sự phản bội chủ động.