Tôi nghĩ đã đến lúc bắt đầu nói về AgentOps. DevOps → MLOps → AgentOps Nếu bạn muốn có những tác nhân tự động hoạt động và mở rộng, chúng ta cần bắt đầu chính thức hóa ngành học hỗ trợ chúng. Một số điều *mọi người* đều phải lo lắng: • Đánh giá tác nhân (sử dụng LLM làm trọng tài hoặc bất kỳ kỹ thuật nào khác) • Phát hành dựa trên chỉ số (gửi phiên bản mới khi chúng vượt qua ngưỡng) • A/B testing cho các tác nhân, phát hành canary, triển khai bóng tối • Bật khả năng quan sát và theo dõi • Triển khai và tích hợp các vòng phản hồi từ con người Bạn không thể xây dựng một tác nhân đáng tin cậy mà không lo lắng về mọi thứ ở trên.