🚨 ANTHROPIC 刚刚推出了一款可以审查自己代码安全性的 AI... 因为 YOLO 这些功能 - 一个终端命令和 GitHub 扫描 - 被誉为 "AI 原生开发" 的 "重大时刻"。 换句话说,机器人终于在做自己的作业了。 这要么是技术安全的下一个巨大飞跃,要么是人类历史上最大的情节漏洞。 同一台编写漏洞的机器现在是我们信任去发现它们的机器。 可能会出什么问题呢? 专家们意见 "分歧",在技术术语中,这意味着一些人忙于撰写赞美的新闻稿,而另一些人则悄悄地将他们的服务器搬进法拉第笼。 来源:StartupNews
Mario Nawfal
Mario Nawfal8月7日 17:40
人类发现如何使人工智能免受糟糕决策的影响 人类声称现在可以为人工智能接种疫苗,以抵御邪恶。 通过使用“人格向量”来追踪欺骗或谄媚等特征,研究人员通过故意注入不良行为来训练语言模型,然后在训练过程中进行纠正。 结果:减少幻觉,增强控制,智力没有下降。 这种方法在问题发生之前引导模型,而不是事后清除特征。 虽然还处于早期阶段,但这项技术可能最终让开发者在机器人开始甜言蜜语地对待独裁者或编造谎言以赢得争论之前,以外科手术般的精确度遏制人工智能的漂移。 来源:techxplore
44.59K