Думаю, настав час почати говорити про AgentOps. DevOps → MLOps → AgentOps Якщо ви хочете автономних агентів, які працюють і масштабуються, нам потрібно почати формалізувати дисципліну, яка їх підтримує. Деякі речі, про які *кожен* має турбуватися: • Оцінка агентів (за допомогою LLM-as-a-judge або будь-якої іншої техніки) • Релізи на основі метрик (випускають нові версії, коли вони перевищують поріг) • A/B тестувальні агенти, випуски канарок, тіньові розгортання • Забезпечення спостережуваності та трасування • Впровадження та інтеграція людських зворотних зв'язків Неможливо створити надійного агента, не турбуючись про все вищезазначене.