Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Manus je skutečně chytrý a rozdělili nástroj do 3 vrstev:
Vrstva 1: Volání funkce
Jedná se o nejzákladnější vrstvu, která zachovává pouze malý počet pevných, atomizovaných funkcí, jako je čtení a zápis souborů, provádění příkazů shellu, vyhledávání souborů atd. V systémové výzvě LLM je pouze tato vrstva definic nástrojů, kterých je relativně málo, do 15, a vstupní a výstupní formáty jsou velmi jasné a není snadné dělat chyby, ale jsou v něm dva speciální nástroje, jeden je Shell a druhý je Soubor.
Úroveň 2: Nástroje sandboxu
Každá relace Manus probíhá v plně virtuálním sandboxu. Jak bylo zmíněno v původním tweetu, virtuální stroj je dodáván s předinstalovaným mnoha nástroji příkazového řádku, jako jsou převodníky formátů, nástroje pro rozpoznávání řeči a dokonce i klient příkazového řádku MCP.
Tyto nástroje jsou pak volány prostřednictvím shellu definovaného ve vrstvě 1, což je nástroj příkazového řádku, volání příkazového řádku.
Ale jak to ví tolik modelů nástrojů?
Manus sděluje LLM přímo v systémovém příkazovém řádku, že v určité složce je mnoho předinstalovaných nástrojů příkazového řádku. Nejčastěji používané nástroje uveďte přímo podle názvu. Pro ty, kteří nejsou běžně používáni, mohou LLM přímo vypsat všechny nástroje příkazové řádky pomocí příkazů zmíněných v původním příkazu a použít parametr --help pro zobrazení použití kteréhokoli z nich, protože všechny jsou vyvinuty samy a mají jednotný formát.
Vrstva 3: Balíčky a rozhraní API
Tato vrstva je ve skutečnosti LLM píšící kód Pythonu v reálném čase a prostřednictvím kódu jsou implementovány složitější funkce. Pokud se například uživatel chce dotazovat na data rozhraní API, může přímo napsat funkci v jazyce Python, která načte data rozhraní API a analyzuje je do požadovaného formátu.
Ve skutečnosti se v Codexu hodně používá kód Pythonu jako nástroj.
Vzhledem k tomu, že složité operace jsou prováděny kódem, výsledky výpočtů znalostí vrácené hlavnímu agentovi nezabírají kontext hlavního agenta.
Výhodou tohoto třívrstvého návrhu je, že z pohledu modelu jsou nástroje, které potřebuje volat, fixovány na zhruba tucet první vrstvy a pomocí příkazového řádku a kódu lze odvodit nespočet kombinací nástrojů.
Dalším bodem je sub-agent, který jsem zmínil ve svém předchozím tweetu, Manus také hodně používá model "agent jako nástroj". Použijte dílčího agenta jako nástroj, například dílčí agent odpovědný za načítání je dílčím agentem, ale tento dílčí agent je nástrojem v očích hlavního agenta. Zároveň může také hrát dobrou roli při redukci kontextu.

Top
Hodnocení
Oblíbené