Saya pikir sudah waktunya untuk mulai berbicara tentang AgentOps. DevOps → MLOps → AgentOps Jika Anda menginginkan agen otonom yang bekerja dan berskala, kita perlu mulai memformalkan disiplin yang mendukung mereka. Beberapa hal yang harus dikhawatirkan *semua orang*: • Evaluasi agen (menggunakan LLM-as-a-judge atau teknik lainnya) • Rilis berbasis metrik (mengirimkan versi baru saat mereka melampaui ambang batas) • Agen pengujian A/B, rilis kenari, penyebaran bayangan • Memungkinkan observabilitas dan pelacakan • Menerapkan dan mengintegrasikan loop umpan balik manusia Anda tidak dapat membangun agen yang andal tanpa mengkhawatirkan semua hal di atas.