分享一點 Codex 實踐經驗:照葫蘆畫瓢法 需求是這樣的,我要重構一個基於 Claude Agent SDK 寫的 Agent UI 的消息發送功能,讓它能支持發送圖片(當前只支持發送文本,圖1) 我不會說:幫我把輸入框改造一下,支持圖片上傳🙅 因為上下文信息太少,你這麼說它肯定做不了。 要實現這個功能,如果手動做的話: 1. 要改造 UI,讓它能支持上傳圖片 2. 要改造 API 接口,讓圖片能從前端傳到後端 3. 要改造服務端處理,讓後端程序將圖片傳給 Claude Agent SDK 所以我首先要把任務拆分,當然理論上來說這些任務最好分成三個小任務依次做,但實際上 GPT-5-Codex High 已經可以一次性完成這樣複雜的任務了,前提是你提示得當,給足上下文。 看我是怎麼提示的(圖2): > 1. 替換現在的發送消息組件為 {參考代碼文件1} > 2. 參考 {參考代碼文件2} 的async send( > prompt: string, > attachments?: AttachmentData[], > includeSelection?: boolean, > ) 和 {參考代碼文件3} 的 > export const composeUserContent = ( > text: string, > attachments?: AttachmentData[], > selection?: SelectionSnapshot | null, > ) 實現對附件的處理 > 3. 點擊發送後,將附件轉成base64字符串後發送給websocket > 4. 參考下面的代碼,重寫 ccsdk/ai-client.ts 的消息處理部分代碼,讓它支持發送附件...