Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Faktum är att Manus är smart och de har delat upp verktyget i 3 lager:
Lager 1: Funktionsanrop
Detta är det mest grundläggande lagret, som bara behåller ett litet antal fasta, atomiserade funktioner, som att läsa och skriva filer, utföra skalkommandon, söka efter filer, etc. I LLM-systemprompten finns det bara detta lager av verktygsdefinitioner, som är relativt få, inom 15, och in- och utdataformaten är mycket tydliga och inte lätta att göra misstag, men det finns två specialverktyg i det, det ena är Shell och det andra är File.
Nivå 2: Sandbox-verktyg
Varje Manus-session körs i en fullständig sandbox-miljö för virtuella datorer. Som nämnts i den ursprungliga tweeten kommer den virtuella maskinen förinstallerad med många kommandoradsverktyg, såsom formatkonverterare, taligenkänningsverktyg och till och med en MCP-kommandoradsklient.
Dessa verktyg anropas sedan genom skalet som definieras i lager 1, som är kommandoradsverktyget, kommandoradsanropet.
Men hur vet så många verktygsmodeller?
Manus berättar för LLM direkt i systemprompten att det finns många förinstallerade kommandoradsverktyg i en specifik mapp. För de vanligaste verktygen listar du dem direkt efter namn. För dem som inte är vanligt förekommande kan LLM:er direkt lista alla kommandoradsverktyg genom de kommandon som nämns i den ursprungliga pushen, och använda parametern --help för att se användningen av någon av dem, eftersom alla är utvecklade av sig själva och har ett enhetligt format.
Lager 3: Paket och API:er
Detta lager är faktiskt LLM som skriver Python-kod i realtid, och mer komplexa funktioner implementeras genom koden. Om en användare till exempel vill fråga efter data i ett API kan de direkt skriva en funktion i Python för att hämta API:ets data och tolka dem till det format som krävs.
Faktum är att i Codex har det använts mycket att använda Python-kod som ett verktyg.
Eftersom komplexa operationer utförs med hjälp av kod upptar inte resultaten av de kunskapsberäkningar som returneras till huvudhandläggaren huvudhandläggarens kontext.
Fördelen med denna treskiktsdesign är att ur ett modellperspektiv är de verktyg som den behöver anropa fixerade till ett dussintal av det första lagret, och med hjälp av kommandoraden och koden kan den härleda otaliga verktygskombinationer.
En annan punkt är den sub-agent som jag nämnde i min tidigare tweet, Manus använder också en hel del "agent som verktyg"-modell. Använd en subagent som ett verktyg, till exempel är den underagent som ansvarar för hämtning en subagent, men denna subagent är ett verktyg i huvudagentens ögon. Samtidigt kan det också spela en bra roll för att minska sammanhanget.

Topp
Rankning
Favoriter