對於代理建設者來說,這是一個重要的時刻! 在軟體中,有一個模式不斷重複。 首先,大家都專注於「建設」問題。 框架出現、成熟,並變得真正優秀。然後突然,限制轉向部署。 我們在神經網絡中看到了這一點。 PyTorch、TensorFlow 和 Caffe 都非常適合構建模型。但部署它們意味著要處理不同的格式和運行時。 ONNX 允許開發者在任何他們想要的框架中構建,導出到標準格式,並在任何地方部署。 我們現在正在觀察代理的同樣模式展開。 像 LangGraph、CrewAI、Agno 和 Strands 這樣的框架已經成熟到構建代理不再是最困難的部分。 相反,接下來發生的事情是:部署、流媒體、記憶體管理、可觀察性和自動擴展。 這些不是代理問題,而是基礎設施問題。而現在,我所談過的每個 AI 團隊都在從零開始解決這些問題。 xpander 正在採取 ONNX 的方法來解決這個問題,我認為這是正確的思維模型。 核心思想很簡單:將你的代理(在任何框架中構建)帶來,通過 xpander 部署,並獲得所有生產基礎設施。 這包括: - 在約 2 分鐘內無伺服器部署 - 用於實時思考用戶體驗的 SSE 流媒體...