DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Indeed, Manus è molto intelligente, hanno suddiviso gli strumenti in 3 livelli: Primo livello: chiamata di funzione (Function Calling) Questo è il livello più basilare, che conserva solo un piccolo gruppo di funzioni fisse e atomiche, come: leggere e scrivere file, eseguire comandi Shell, cercare file, ecc. Nella frase di sistema dell'LLM ci sono solo le definizioni degli strumenti di questo livello, relativamente poche, meno di 15, il formato di input e output è molto chiaro, difficile da sbagliare, ma ci sono due strumenti molto speciali, uno è Shell, l'altro è File. Secondo livello: strumenti sandbox (Sandbox Utilities) Ogni sessione di Manus viene eseguita in una sandbox di macchina virtuale completa. È quanto menzionato nel tweet originale, la macchina virtuale ha preinstallati molti strumenti da riga di comando, come convertitori di formato, strumenti di riconoscimento vocale, persino un client da riga di comando mcp. E questi strumenti vengono chiamati tramite Shell definita nel primo livello, cioè strumenti da riga di comando, chiamate da riga di comando. Ma come fa il modello a sapere di così tanti strumenti? Manus dirà direttamente all'LLM nella frase di sistema che in una cartella specifica ci sono molti strumenti da riga di comando preinstallati. Per gli strumenti più comuni, elencherà direttamente i loro nomi. Per quelli meno comuni, l'LLM può elencare direttamente tutti gli strumenti da riga di comando tramite il comando menzionato nel tweet originale, utilizzando il parametro --help per vedere l'uso di qualsiasi strumento, poiché tutti questi strumenti sono stati sviluppati da loro, con un formato uniforme. Terzo livello: pacchetti e API (Packages and APIs) Questo livello è in realtà dove l'LLM scrive codice Python in tempo reale, implementando funzionalità più complesse attraverso il codice. Ad esempio, se un utente desidera interrogare i dati di un'API, può semplicemente scrivere una funzione in Python per recuperare i dati dell'API e analizzarli nel formato desiderato. In effetti, in Codex, l'uso del codice Python come strumento è già molto comune. Poiché i calcoli complessi vengono eseguiti dal codice, il risultato della conoscenza restituito all'Agente principale non occupa il contesto dell'Agente principale. Il vantaggio di questo design a 3 livelli è che, dal punto di vista del modello, gli strumenti che deve chiamare sono fissi, cioè una dozzina del primo livello, mentre grazie alla riga di comando e al codice, può derivare innumerevoli combinazioni di strumenti. Un'altra cosa è che, come ho menzionato nel tweet precedente, Manus adotta anche ampiamente il modello "agente come strumento (agent as tool)". Utilizza gli agenti secondari come strumenti, ad esempio, un agente secondario responsabile della ricerca, ma per l'Agente principale, questo agente secondario è semplicemente uno strumento. Allo stesso tempo, può anche ridurre efficacemente il contesto.

Principali

Ranking

Preferiti