DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Ciertamente, Manus es muy inteligente, han dividido las herramientas en 3 capas: Capa 1: Llamadas a funciones (Function Calling) Esta es la capa más básica, que solo conserva un pequeño grupo de funciones fijas y atómicas, como: leer y escribir archivos, ejecutar comandos de Shell, buscar archivos, etc. En el aviso del sistema de LLM solo se define esta capa de herramientas, que es relativamente pequeña, menos de 15, el formato de entrada y el formato de salida son muy claros, no es fácil cometer errores, pero hay dos herramientas que son muy especiales, una es Shell y la otra es File. Capa 2: Herramientas de sandbox (Sandbox Utilities) Cada sesión de Manus se ejecuta en un sandbox de máquina virtual completo. Es lo que se mencionó en el tweet original, la máquina virtual viene preinstalada con muchas herramientas de línea de comandos, como convertidores de formato, herramientas de reconocimiento de voz, e incluso un cliente de línea de comandos mcp. Luego, estas herramientas se llaman a través de Shell definido en la Capa 1, es decir, herramientas de línea de comandos, llamadas de línea de comandos. Pero, ¿cómo sabe el modelo de tantas herramientas? Manus le dirá directamente al LLM en el aviso del sistema que hay muchas herramientas de línea de comandos preinstaladas en una carpeta específica. Para las herramientas más utilizadas, simplemente se enumeran sus nombres. Para las menos utilizadas, el LLM puede listar directamente todas las herramientas de línea de comandos mencionadas en el tweet original, usando el parámetro --help para ver cómo usar cualquiera de las herramientas, ya que todas estas herramientas son desarrolladas por ellos, con un formato unificado. Capa 3: Paquetes y API (Packages and APIs) Esta capa en realidad permite que el LLM escriba código Python en tiempo real, implementando funciones más complejas a través del código. Por ejemplo, si un usuario quiere consultar datos de una API, puede escribir directamente una función en Python para obtener los datos de la API y analizarlos en el formato necesario. De hecho, en Codex, ya se ha utilizado mucho el código Python como herramienta. Dado que los cálculos complejos se realizan mediante código, el resultado se devuelve al Agente Principal, por lo que no ocupa el contexto del Agente Principal. La ventaja de este diseño de 3 capas es que, desde la perspectiva del modelo, las herramientas que necesita llamar son fijas, son unas pocas de la Capa 1, y gracias a la línea de comandos y al código, puede derivar innumerables combinaciones de herramientas. Además, como mencioné en un tweet anterior sobre los subagentes, Manus también adopta en gran medida el modelo de "agente como herramienta (agent as tool)". Utiliza subagentes como herramientas, por ejemplo, un subagente responsable de la búsqueda, pero para el Agente Principal, este subagente es simplemente una herramienta. Al mismo tiempo, también puede ayudar a reducir el contexto.

Parte superior

Clasificación

Favoritos