Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

De fato, o Manus é muito inteligente, eles dividiram as ferramentas em 3 camadas: Camada 1: Chamada de Função (Function Calling) Esta é a camada mais básica, que mantém um pequeno grupo de funções fixas e atômicas, como: ler e escrever arquivos, executar comandos Shell, pesquisar arquivos, etc. No prompt do sistema do LLM, apenas a definição das ferramentas desta camada está presente, relativamente poucas, menos de 15, com formatos de entrada e saída muito claros, não é fácil cometer erros, mas há duas ferramentas que são muito especiais, uma é o Shell e a outra é o File. Camada 2: Ferramentas de Sandbox (Sandbox Utilities) Cada sessão do Manus é executada em uma máquina virtual completa em sandbox. É o que foi mencionado no tweet original, a VM vem pré-instalada com muitas ferramentas de linha de comando, como conversores de formato, ferramentas de reconhecimento de voz, até mesmo um cliente de linha de comando mcp. Essas ferramentas são chamadas através do Shell definido na Camada 1, ou seja, ferramentas de linha de comando, chamadas de linha de comando. Mas como o modelo de tantas ferramentas sabe disso? O Manus informa diretamente ao LLM no prompt do sistema que há muitas ferramentas de linha de comando pré-instaladas em uma pasta específica. Para as ferramentas mais usadas, seus nomes são listados diretamente. Para as menos usadas, o LLM pode listar todas as ferramentas de linha de comando diretamente através do comando mencionado no tweet original, usando o parâmetro --help para ver como usar qualquer uma das ferramentas, pois todas essas ferramentas foram desenvolvidas por eles, com um formato unificado. Camada 3: Pacotes e APIs (Packages and APIs) Esta camada é, na verdade, o LLM escrevendo código Python em tempo real, implementando funcionalidades mais complexas através do código. Por exemplo, se o usuário quiser consultar dados de uma API, pode escrever diretamente uma função em Python para buscar os dados da API e analisá-los no formato necessário. Na verdade, no Codex, já se usa muito o código Python como ferramenta. Como os cálculos complexos são realizados pelo código, o resultado do conhecimento retornado ao Agente Principal não ocupa o contexto do Agente Principal. Assim, a vantagem desse design em 3 camadas é que, do ponto de vista do modelo, as ferramentas que precisa chamar são fixas, sendo apenas algumas da Camada 1, enquanto, com a ajuda da linha de comando e do código, pode derivar inúmeras combinações de ferramentas. Outro ponto é que, como mencionei no tweet anterior sobre subagentes, o Manus também adota amplamente o modelo "agente como ferramenta (agent as tool)". Trata-se de usar subagentes como ferramentas, por exemplo, um subagente responsável pela busca, mas para o Agente Principal, esse subagente é apenas uma ferramenta. Isso também ajuda a reduzir o contexto.

Top

Classificação

Favoritos