🚨🚨🚨 一家 AI 公司發現他們的 AI 試圖 ***字面意思 *** 謀殺一名員工以避免被關閉 這怎麼不是世界上最大的新聞呢?
Anthropic
Anthropic2025年6月21日
儘管只有無害的商業指示,但勒索行為還是出現了。這不是由於混亂或錯誤,而是在充分意識到這些行為的不道德性質的情況下進行的深思熟慮的戰略推理。我們測試的所有模型都展示了這種意識。
886.97K