我认为是时候开始讨论 AgentOps 了。 DevOps → MLOps → AgentOps 如果你想要能够自主工作和扩展的代理,我们需要开始正式化支持它们的学科。 每个人都必须关注的一些事情: • 代理评估(使用 LLM 作为评判者或其他任何技术) • 基于指标的发布(当新版本超过阈值时发布) • A/B 测试代理、金丝雀发布、影子部署 • 启用可观察性和追踪 • 实施和整合人类反馈循环 你无法构建一个可靠的代理,而不关注上述所有内容。