代理构建者的重大时刻! 软件中有一个不断重复的模式。 首先,每个人都专注于“构建”问题。 框架出现、成熟,并变得真正优秀。然后,突然间,约束条件转向部署。 我们在神经网络中看到了这一点。 PyTorch、TensorFlow 和 Caffe 都非常适合构建模型。但部署它们意味着要处理不同的格式和运行时。 ONNX 允许开发者在任何他们想要的框架中构建,导出为标准格式,并在任何地方部署。 我们现在正在观察代理的相同模式展开。 像 LangGraph、CrewAI、Agno 和 Strands 这样的框架已经成熟到构建代理不再是最困难的部分。 相反,接下来发生的事情是:部署、流媒体、内存管理、可观察性和自动扩展。 这些不是代理问题,而是基础设施问题。而现在,我所谈过的每个 AI 团队都在从头解决这些问题。 xpander 正在采用 ONNX 的方法来解决这个问题,我认为这是正确的思维模型。 核心思想很简单:将你的代理(在任何框架中构建)通过 xpander 部署,并获得所有生产基础设施。 这包括: - 在 ~2 分钟内无服务器部署 - 实时思维用户体验的 SSE 流媒体...