Myślę, że nadszedł czas, aby zacząć rozmawiać o AgentOps. DevOps → MLOps → AgentOps Jeśli chcesz autonomicznych agentów, którzy działają i skalują, musimy zacząć formalizować dyscyplinę, która je wspiera. Niektóre z rzeczy, o które *wszyscy* muszą się martwić: • Oceny agentów (używając LLM jako sędziego lub jakiejkolwiek innej techniki) • Wydania oparte na metrykach (wypuszczaj nowe wersje, gdy przekroczą próg) • Testowanie A/B agentów, wydania kanarkowe, wdrożenia w trybie shadow • Umożliwienie obserwowalności i śledzenia • Wdrażanie i integrowanie pętli sprzężenia zwrotnego od ludzi Nie możesz zbudować niezawodnego agenta, nie martwiąc się o wszystko powyżej.