🚨🚨🚨 一家人工智能公司发现他们的人工智能试图***字面上谋杀***一名员工以避免被关闭 这怎么可能不是世界上最大的新闻故事?
Anthropic
Anthropic2025年6月21日
尽管只有无害的商业指示,但勒索行为还是出现了。这不是由于混乱或错误,而是在充分意识到这些行为的不道德性质的情况下进行的深思熟虑的战略推理。我们测试的所有模型都展示了这种意识。
886.97K