為什麼我用了那麼多提示詞模板甚至用了 AI 幫忙還是寫不好提示詞? 上次我分享了一個模擬雷軍演講的提示詞,廣受好評,但也有網友想知道我是怎麼寫出這樣的提示詞的。授人以魚不如授人以漁,還是繼續分享一下寫好提示詞的方法論。 現在流行的是上下文工程(Context Engineering),似乎很少有人提起提示詞工程(Prompt Engineering),甚至很多人覺得提示詞工程已經不需要了: > “模型已經那麼強了,還要啥提示詞工程,我寫什麼提示詞大模型都能知道我的意思執行的很好。” 這話只是部分正確,模型是已經越來越強了,普通的需求確實只要簡單的提示,但是複雜的需求還是要藉助提示詞工程才能寫的好。 **那麼什麼是提示詞工程?** > 提示詞工程是一個過程,系統化地設計、測試、優化提示詞的過程——寶玉 網上分享的提示詞或者各種提示詞模板,它不是提示詞工程,是提示詞,是靜態的,產生這些提示詞的過程才叫提示詞工程。 舉幾個我最近寫提示詞的例子。 第一個例子就是我怎麼寫雷軍演講這個提示詞的。 往下看之前不妨停下來想一想,如果你來寫怎麼寫? 我是這麼做的: 先用 Deep Research 去收集雷軍的演講,然後讓 AI 基於 AI 的演講結果生成一個模仿雷軍演講的提示詞。 (圖1) AI 生成了提示詞後,我拿去測試了一下,雖然也生成了一個類似雷軍風格的演講稿,但是內容平淡無奇,結果並不怎麼理想。 (圖2) 我用相同的方法分別去 ChatGPT 和 Claude 上測試了,評估下來結果都不怎麼好。 看來 Deep Research 搜索出來的結果並不夠好,可能很多都不是雷軍的演講,只是新聞報道之類,後來正好在 X 上看到有網友轉載的早年有人整理的雷軍演講風格總結,於是用它試試看: > 請幫我生成一個 Prompt,可以把輸入的主題或文本生成雷軍風格的演講稿。以下是網友總結的內容作為參考: > \<tweet > > 雷軍有一個非常牛的技能,就是把一件平平無奇或者並沒有那麼厲害的東西用數字、百分比或者其他的形容詞給描述成一個聽上去可望而不可即的物品。 > 發佈會後,極氪高管吐槽小米汽車:小米的營銷值得我們學習,但是汽車技術上小米應該向我們學習。 > 雷軍的 PPT 和王家衛的電影臺詞有異曲同工之妙。 > 舉個例子,普通人下一碗面就是我什麼時候在哪下一碗什麼面。但是雷軍的PPT 會這樣說:經我們小米的員工連續300個日夜不間斷的大數據研究發現,97%的人類在早晨七點零三分56秒的時候會出現明顯的飢餓感,相比較七點整,飢餓感整整提升了57%。 > 為了解決這種困擾人類幾千年的飢餓感,我們小米工程師們反覆研究比對發現,麪粉的飽腹感要比大米的飽腹感高出21%。 > 於是我們專門找到了麪粉原料小麥的5萬年前的發源地 --位於中東的新月沃土,砸重金在新月沃土研製出了一款迄今為止最有飽腹感的麪條。 > 那麼究竟多有飽腹感呢? 比傳統的麪條飽腹感提升了73%。同時卡路里下降50%。 > 我們也給它取了一個好聽的名字,叫小米超級空心面。同時呢,我們還聯合飲用水的行業巨頭--農夫山泉研製出了業內首創的泡麪專用水-農夫米泉。用我們農夫米泉煮出來的麪條飽腹感還能再提升11% > 9.9元3斤小米空心強飽腹感麪條。(麪粉成本1.6元一斤而已)免費送十包調料。總共有9款粗細不同,6種種包裝顏色可選 > \</tweet> (圖3) 用生成後的提示詞去測試了一下,效果極好! 就這麼簡單! (圖4)
我把這個過程畫成了一張圖 (圖1) 所有的提示詞創作都是這樣一個迭代的過程: 0. 目標:先設定一個目標,你期望你的提示詞能達到什麼樣的效果。 1. 想法:有了目標你需要有個想法怎麼來寫,比如可以手寫,可以 AI 幫你寫,可以套模板 2. 寫提示詞:不用想那麼多,先寫一個版本出來。就好比你在練習射擊,別想太多,先瞄準開一槍。 3. 測試提示詞:得到第一個版本 Prompt 後,去測試你的提示詞。 4. 評估:拿到測試結果後,看看實際結果和你期望的結果有多大差距,差距在哪裡。就好比你朝靶子開了一槍後,量一下離靶心多遠。 如果評估結果達不到你設定的目標,那麼就從第 1 步開始,基於上一個版本的結果繼續迭代。有時候運氣好,一次就得到了好的結果,有時候就需要反覆迭代。 再比如上一次我創作 YouTube 字幕生成的提示詞 時,迭代了十幾個版本,一開始是對格式不滿意,後來發現它總是在段落中間加上時間戳,非常影響閱讀體驗,但是怎麼在提示詞裡面強調讓它不要在段落中間加時間戳都不起作用。 (圖2) 最後靈機一動在 Few-Shot 的例子裡面,加了一個如果同一個人發言內容太長就拆分成兩段顯示的例子,終於是不會再在段落內加時間戳了。 (圖3) 所以回頭總結一下,很多人寫不好提示詞,根源其實不是找不到好的模板,或者 AI 幫不了你,而是*你是不是能評估出當前提示詞生成結果離目標的差距,以及知道怎麼調整。* 這也是為什麼專業領域的提示詞,通常還需要有專業背景才能寫得好,比如一個不懂編程的人去用 AI 編程,就算套用一堆的提示詞模板,也一樣難用 AI 寫好,因為他們無法判斷提示詞生成的結果是不是滿足要求,如果不滿足差距在哪裡,怎麼調整。
150.6K