Într-adevăr, Manus este inteligent și au împărțit instrumentul în 3 straturi: Stratul 1: Apelarea funcției Acesta este cel mai de bază strat, care păstrează doar un număr mic de funcții fixe, atomizate, cum ar fi citirea și scrierea fișierelor, executarea comenzilor shell, căutarea fișierelor etc. În promptul sistemului LLM, există doar acest strat de definiții de instrumente, care sunt relativ puține, în limita a 15, iar formatele de intrare și ieșire sunt foarte clare și nu sunt ușor de făcut greșeli, dar există două instrumente speciale în el, unul este Shell și celălalt este File. Nivelul 2: Utilitare sandbox Fiecare sesiune Manus rulează într-un sandbox complet al mașinii virtuale. După cum am menționat în tweet-ul original, mașina virtuală este preinstalată cu multe instrumente de linie de comandă, cum ar fi convertoare de format, instrumente de recunoaștere a vorbirii și chiar un client de linie de comandă MCP. Aceste instrumente sunt apoi apelate prin shell-ul definit în stratul 1, care este instrumentul de linie de comandă, apelul liniei de comandă. Dar de unde știu atât de multe modele de instrumente? Manus îi spune LLM-ului direct în promptul de sistem că există multe instrumente de linie de comandă preinstalate într-un anumit folder. Pentru cele mai frecvent utilizate instrumente, enumerați-le direct după nume. Pentru cei care nu sunt folosiți în mod obișnuit, LLM-urile pot lista direct toate instrumentele de linie de comandă prin comenzile menționate în push-ul original și pot folosi parametrul --help pentru a vedea utilizarea oricăreia dintre ele, deoarece toate sunt dezvoltate de ele însele și au un format uniform. Nivelul 3: Pachete și API-uri Acest strat este de fapt LLM care scrie cod Python în timp real, iar funcții mai complexe sunt implementate prin cod. De exemplu, dacă un utilizator dorește să interogheze datele unui API, poate scrie direct o funcție în Python pentru a prelua datele API-ului și a le analiza în formatul necesar. De fapt, în Codex, utilizarea codului Python ca instrument a fost folosită foarte mult. Deoarece operațiunile complexe sunt efectuate prin cod, rezultatele calculelor de cunoștințe returnate agentului principal nu ocupă contextul agentului principal. Avantajul acestui design cu trei straturi este că, din perspectiva modelului, instrumentele pe care trebuie să le apeleze sunt fixate la aproximativ o duzină din primul strat și, cu ajutorul liniei de comandă și al codului, poate deriva nenumărate combinații de instrumente. Un alt punct este sub-agentul pe care l-am menționat în tweet-ul meu anterior, Manus folosește și o mulțime de modele "agent ca instrument". Utilizați un sub-agent ca instrument, de exemplu, sub-agentul responsabil pentru recuperare este un sub-agent, dar acest sub-agent este un instrument în ochii agentului principal. În același timp, poate juca un rol bun în reducerea contextului.