Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Rzeczywiście, Manus jest bardzo inteligentny, podzielili narzędzia na 3 warstwy:
Warstwa 1: Wywołanie funkcji (Function Calling)
To najprostsza warstwa, która zawiera tylko małą grupę stałych, atomowych funkcji, takich jak: odczyt i zapis plików, wykonywanie poleceń Shell, wyszukiwanie plików itp. W systemowym komunikacie LLM znajduje się tylko definicja narzędzi z tej warstwy, jest ich stosunkowo mało, poniżej 15, format wejściowy i wyjściowy są bardzo jasne, trudno popełnić błąd, ale w tej warstwie są dwa szczególne narzędzia, jedno to Shell, a drugie to File.
Warstwa 2: Narzędzia w piaskownicy (Sandbox Utilities)
Każda sesja Manus działa w pełnej wirtualnej maszynie w piaskownicy. To, o czym wspomniano w oryginalnym tweecie, wirtualna maszyna ma wiele wstępnie zainstalowanych narzędzi wiersza poleceń, takich jak konwertery formatów, narzędzia do rozpoznawania mowy, a nawet klient wiersza poleceń mcp.
Te narzędzia są wywoływane za pomocą Shell zdefiniowanego w warstwie 1, czyli narzędzi wiersza poleceń, wywołania wiersza poleceń.
Ale jak model narzędzi wie o tylu narzędziach?
Manus bezpośrednio informuje LLM w systemowym komunikacie, że w określonym folderze znajduje się wiele wstępnie zainstalowanych narzędzi wiersza poleceń. Dla najczęściej używanych narzędzi wymienia ich nazwy. Dla rzadziej używanych, LLM może bezpośrednio wymienić wszystkie narzędzia wiersza poleceń za pomocą polecenia wspomnianego w oryginalnym tweecie, używając parametru --help, aby zobaczyć, jak używać dowolnego narzędzia, ponieważ wszystkie te narzędzia są opracowane przez nich, a format jest jednolity.
Warstwa 3: Pakiety i API (Packages and APIs)
Ta warstwa to w rzeczywistości LLM, który na bieżąco pisze kod w Pythonie, aby zrealizować bardziej złożone funkcje. Na przykład, jeśli użytkownik chce zapytać o dane z określonego API, może bezpośrednio napisać funkcję w Pythonie, aby pobrać dane z API i przetworzyć je na potrzebny format.
W rzeczywistości w Codex używanie kodu Python jako narzędzia jest już bardzo powszechne.
Ponieważ złożone obliczenia są realizowane przez kod, zwracane do Głównego Agenta są wyniki obliczeń wiedzy, więc nie zajmują kontekstu Głównego Agenta.
Zaleta takiego projektu w 3 warstwach polega na tym, że z perspektywy modelu narzędzia, które musi wywołać, są stałe i ograniczone do kilkunastu z warstwy 1, a dzięki wierszowi poleceń i kodowi może generować niezliczone kombinacje narzędzi.
Jeszcze jedna rzecz, o której wspomniałem w poprzednim tweecie, to podagent, Manus również w dużej mierze przyjmuje model „agent jako narzędzie (agent as tool)”. Traktuje podagenta jako narzędzie, na przykład odpowiedzialnego za wyszukiwanie, ale ten podagent w oczach Głównego Agenta jest po prostu narzędziem. Może to również skutecznie zmniejszyć kontekst.

Najlepsze
Ranking
Ulubione