Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Перше масштабне дослідження агентів ШІ, які фактично працюють у виробництві.
Хайп каже, що агенти трансформують усе. Дані розповідають іншу історію.
Дослідники опитали 306 практиків і провели 20 глибоких кейс-стаді у 26 сферах. Те, що вони виявили, кидає під сумнів поширені уявлення про те, як будуються виробничі агенти.
Реальність: виробничі агенти навмисно прості та жорстко обмежені.
1) Візерунки та надійність
- 68% виконали не більше 10 кроків перед тим, як потребувати людського втручання.
- 47% виконали менше ніж 5 кроків.
- 70% покладаються на підказки готових моделей без будь-яких тонких налаштувань.
- 74% переважно залежить від оцінки людини.
Команди навмисно обмінюють автономію на надійність.
Чому ці обмеження? Надійність залишається головною невирішеною проблемою. Практики не можуть перевірити коректність препарату у масштабі. Публічні бенчмарки рідко застосовуються до доменно-специфічних виробничих завдань. 75% опитаних команд оцінюють оцінку без формальних бенчмарків, покладаючись на A/B тестування та прямий зворотний зв'язок користувачів.
2) Вибір моделі
Патерн вибору моделі здивував дослідників. 17 із 20 кейсів використовують закриті моделі фронтиру, такі як Claude Sonnet 4, Claude Opus 4.1 та GPT o3. Впровадження відкритого коду є рідкістю і зумовлене специфічними обмеженнями: великим обсягом робочих навантажень, де витрати на виведення стають надмірними, або регуляторними вимогами, що забороняють обмін даними з зовнішніми провайдерами. Для більшості команд витрати на час виконання незначні порівняно з тими, як і серед людей, яких агент доповнює.
3) Агентні фреймворки
Впровадження рамок демонструє разючу відмінність. 61% респондентів використовують сторонні фреймворки, такі як LangChain/LangGraph. Але 85% опитаних команд із виробничими розгортаннями створюють власні реалізації з нуля. Причина: основні цикли агентів легко реалізувати за допомогою прямих викликів API. Команди віддають перевагу мінімальним, спеціально створеним риштуванням над надмірним залежностями та шарами абстракції.
4) Потік керування агентом
Виробничі архітектури віддають перевагу заздалегідь визначеним статичним робочим процесам замість відкритої автономії. 80% кейсів використовують структурований контрольний потік. Агенти діють у добре окреслених просторах дії, а не вільно досліджують оточення. Лише один випадок дозволяв необмежене дослідження, і ця система працює виключно в пісочничних середовищах із суворою перевіркою CI/CD....

Найкращі
Рейтинг
Вибране

