Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
První rozsáhlá studie o agentech umělé inteligence skutečně běžících v produkci.
Říká se, že agenti mění všechno. Data vyprávějí jiný příběh.
Výzkumníci provedli průzkum mezi 306 praktiky a provedli 20 podrobných případových studií napříč 26 oblastmi. To, co zjistili, zpochybňuje běžné předpoklady o tom, jak jsou výrobní agenti konstruováni.
Realita: výrobní agenti jsou záměrně prostí a přísně omezeni.
1) Vzory a spolehlivost
- 68 % provádí maximálně 10 kroků před nutností lidského zásahu.
- 47 % dokončeno méně než 5 kroků.
- 70 % spoléhá na prompting hotové modely bez jakéhokoliv doladění.
- 74 % závisí především na lidském hodnocení.
Týmy záměrně vyměňují autonomii za spolehlivost.
Proč ta omezení? Spolehlivost zůstává největším nevyřešeným problémem. Odborníci nemohou ověřit správnost látky ve velkém měřítku. Veřejné benchmarky se zřídka vztahují na produkční úkoly specifické pro dané dané oblasti. 75 % týmů, které byly dotazovány, hodnotí bez formálních benchmarků, spoléhají na A/B testování a přímou zpětnou vazbu od uživatelů.
2) Výběr modelu
Vzorec výběru modelu překvapil výzkumníky. 17 z 20 případových studií používá uzavřené frontier modely jako Claude Sonnet 4, Claude Opus 4.1 a GPT o3. Open-source přijetí je vzácné a je řízeno specifickými omezeními: objemové pracovní zátěže, kde jsou náklady na inferenci neúnosné, nebo regulační požadavky bránící sdílení dat s externími poskytovateli. Pro většinu týmů jsou náklady na běh zanedbatelné ve srovnání s lidskými experty, které agent rozšiřuje.
3) Agentní rámce
Přijetí rámců vykazuje výrazný rozdíl. 61 % respondentů průzkumu používá rámce třetích stran jako LangChain/LangGraph. Ale 85 % týmů, které byly interviewovány s produkčními nasazeními, vytváří vlastní implementace od nuly. Důvod: jádrové agentní smyčky jsou jednoduché na implementaci pomocí přímých API volání. Týmy dávají přednost minimalistým, účelově vytvořeným lešení před vrstvami závislosti a abstrakcí.
4) Tok řízení agentů
Produkční architektury upřednostňují předdefinované statické pracovní postupy před otevřenou autonomií. 80 % případových studií používá strukturovaný řídicí tok. Agenti působí v dobře prozkoumaných akčních prostorech, nikoli v otevřeném prozkoumávání prostředí. Pouze jeden případ umožňoval neomezené průzkumy a tento systém běží výhradně v sandboxových prostředích s přísnou verifikací CI/CD....

Top
Hodnocení
Oblíbené

