我認為是時候開始談論 AgentOps 了。 DevOps → MLOps → AgentOps 如果你想要能夠自主運作並且可擴展的代理,我們需要開始正式化支持它們的學科。 每個人都必須擔心的一些事情: • 代理評估(使用 LLM 作為評審或任何其他技術) • 基於指標的發布(當新版本超過閾值時發佈) • A/B 測試代理、金絲雀發布、影子部署 • 啟用可觀察性和追蹤 • 實施和整合人類反饋循環 你無法在不擔心上述所有內容的情況下構建可靠的代理。