Andrej Karpathy 支援在使用 LLM 的 AI 軟體開發中引入一個與“上下文工程”相關的新術語。 長期以來,這個詞似乎非常必要。每次我向人們解釋我們如何開發 Nethermind AuditAgent 時,除了使用領域專業知識(web3 安全)和使用最好的 AI 模型(來自 OpenAI、Anthropic 和 Google)和 LLM 工具外,其中一個關鍵方面就是“上下文工程”。 有時會有一句話 「context is the king」 ,這確實是真的。LLM,無論是大型高級 LLM 還是優化的小型 LLM,都是一個強大的工具,但就像任何工具一樣,如果它落入壞人之手,您得到的結果將遠不如正確使用它們時那麼有希望。上下文管理(或工程)確實是一個複雜且沒有得到充分描述的領域,它不斷發展,它實際上是作為快速工程概念的延伸出現的,而提示工程的概念已經有一些負面含義。 總的來說,Andrej 列出了與上下文工程相關的主要方面(在第二張截圖中),但在每個具體任務中,人們主要通過反覆試驗來取得出色的結果,每次都單調地嘗試選擇在這個解決問題階段真正需要的正確上下文元素,為每個階段收集基準,查看指標,將數據集劃分為測試, 驗證,依此類推。 您如何看待「上下文工程」?
Andrej Karpathy
Andrej Karpathy2025年6月25日
+1 表示 “context engineering” 超過 “prompt engineering”。 人們將提示與您在日常使用中會給 LLM 的簡短任務描述相關聯。在每個工業級 LLM 應用程式中,上下文工程都是一門微妙的藝術和科學,它為下一步填充了正確的資訊。科學,因為做對了這件事涉及任務描述和解釋、少數鏡頭示例、RAG、相關(可能是多模態)數據、工具、狀態和歷史記錄、壓縮......太少或形式錯誤,並且 LLM 沒有正確的上下文來獲得最佳性能。太多或太不相關,LLM 成本可能會上升,性能可能會下降。做好這件事非常重要。而藝術是因為圍繞 LLM 心理學的指導直覺。 除了上下文工程本身之外,LLM 應用程式還必須: - 將問題直接分解到控制流中 - 恰到好處地打包上下文視窗 - 將調用分派給正確類型和能力的 LLM - 處理生成驗證 UIUX 流程 - 更多 - 護欄、安全、評估、並行、預取...... 因此,上下文工程只是新興的厚層非平凡軟體中的一小部分,該軟體將單個 LLM 調用(以及更多)協調到完整的 LLM 應用程式中。“ChatGPT 包裝器”這個詞很累,而且真的非常非常錯誤。
489