Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

Действительно, Manus очень умный, они разделили инструменты на 3 уровня: 1 уровень: Вызов функций (Function Calling) Это самый базовый уровень, который содержит небольшую группу фиксированных, атомарных функций, таких как: чтение и запись файлов, выполнение команд Shell, поиск файлов и т.д. В системных подсказках LLM определены только инструменты этого уровня, их относительно немного, менее 15, формат ввода и вывода очень четкий, ошибки возникают редко, но среди них есть два особых инструмента: один - Shell, другой - File. 2 уровень: Инструменты песочницы (Sandbox Utilities) Каждая сессия Manus работает в полноценной виртуальной машине-песочнице. Это то, о чем упоминалось в оригинальном твите, виртуальная машина предустановлена с множеством командных инструментов, таких как конвертеры форматов, инструменты распознавания речи, даже клиент командной строки mcp. Затем эти инструменты вызываются через Shell, определенный на 1 уровне, то есть командные инструменты, вызовы командной строки. Но как же модель инструментов знает обо всех этих инструментах? Manus прямо говорит LLM в системных подсказках, что в определенной папке есть много предустановленных командных инструментов. Для самых часто используемых инструментов просто перечисляются их названия. Для менее распространенных LLM может напрямую перечислить все командные инструменты, упомянув команду, через параметр --help, чтобы узнать, как использовать любой из инструментов, так как все эти инструменты разработаны ими, формат унифицирован. 3 уровень: Пакеты и API (Packages and APIs) Этот уровень на самом деле представляет собой написание Python-кода в реальном времени LLM, чтобы реализовать более сложные функции. Например, если пользователь хочет запросить данные из определенного API, он может просто написать функцию на Python, чтобы получить данные API и разобрать их в нужный формат. На самом деле в Codex уже много раз использовался Python-код в качестве инструмента. Поскольку сложные вычисления выполняются кодом, результаты возвращаются главному агенту после вычислений знаний, поэтому это не занимает контекст главного агента. Таким образом, преимущество дизайна из 3 уровней заключается в том, что с точки зрения модели инструменты, которые необходимо вызывать, фиксированы на уровне 1, а с помощью командной строки и кода можно создать бесчисленное множество комбинаций инструментов. Еще один момент, который я упоминал в предыдущем твите, это подагенты, Manus также широко использует модель "агент как инструмент (agent as tool)". Подагенты рассматриваются как инструменты, например, подагент, отвечающий за поиск, но для главного агента этот подагент является просто инструментом. Это также хорошо помогает уменьшить контекст.

Топ

Рейтинг

Избранное