无论是 Web2 还是 Web3 的 AI Agent,都以大型语言模型(LLM)作为核心技术基石。可以说,LLM 的崛起让 AI Agent 成为现实,并为其商业化铺平了道路。 经过早期技术积累后,LLM 在 2022 年迎来应用爆发。OpenAI 发布 GPT-3.5,其在自然语言处理技术的方面再次取得重大进步,但此时的 AGI 并未达到 “Agent” 等级。自 2023 年起,全球多家厂商陆续发布包括 LLaMA、BLOOM、StableLM、ChatGLM 等在内的多个开源大型语言模型(LLM)。Voiceflow 这类 AI Agent 创建平台也随之出现,在 2023 年 8 月,Voiceflow 就已经有超过 13 万个团队在 Voiceflow 构建 AI Agent。2024 年后,LLM 竞争逐渐激烈,包括 Gemini 2.0、DeepSeek R1 在内的 LLM 升级版和新 LLM 不断推出,因竞争带来的逐渐降低的使用成本、越发强大的分析能力以及更多的 AI Agent 工具让更多人跃跃欲试。 随着 LLM 的性能不断提升,AI Agent 不再仅仅是研究领域的概念,而是成为了现实中的工具。2024 年,微软在 Dynamics 365 中集成了 10 个自主 AI 智能体,这些智能体可以自动完成客服、销售、财务、仓储等任务流程。谷歌在同年年底发布了多模态大模型 Gemini 2.0,并基于此推出了三个新的智能体原型,包括通用大模型助手 Project Astra 和编程助手 Jules。2025 年,OpenAI 推出了首款 AI 智能体 Operator,能够自动完成诸如编写代码、预订旅行和电商购物等复杂操作。随着 LLM 企业直接推出 AI Agent,其核心目的是吸引开发者和构建者使用自家 LLM 技术,扩展应用场景并增加营收。这种从研究到应用的过渡,也标志着 AI Agent 技术进入了新的发展阶段。