Waarom kan ik met zoveel sjablonen voor prompts en zelfs met hulp van AI nog steeds geen goede prompts schrijven? De laatste keer dat ik een prompt deelde die een toespraak van Lei Jun simuleerde, was het zeer goed ontvangen, maar er waren ook mensen die wilden weten hoe ik zo'n prompt heb geschreven. Iemand leren vissen is beter dan iemand een vis geven, dus ik blijf de methodologie voor het schrijven van goede prompts delen. Wat nu populair is, is context engineering, maar het lijkt erop dat er weinig mensen zijn die over prompt engineering praten, en veel mensen denken zelfs dat prompt engineering niet meer nodig is: > "Het model is al zo sterk, wat heb ik nog aan prompt engineering? Wat ik ook schrijf, het grote model begrijpt mijn bedoeling en voert het goed uit." Dit is slechts gedeeltelijk waar; het model wordt inderdaad steeds sterker, en voor gewone behoeften zijn eenvoudige prompts voldoende, maar voor complexe behoeften is prompt engineering nog steeds nodig om het goed te doen. **Wat is prompt engineering?** > Prompt engineering is een proces waarbij prompts systematisch worden ontworpen, getest en geoptimaliseerd. — Baoyu De prompts die online worden gedeeld of verschillende sjablonen voor prompts zijn geen prompt engineering; het zijn prompts, statisch, en het proces dat deze prompts genereert, is wat prompt engineering wordt genoemd. Hier zijn een paar voorbeelden van prompts die ik recentelijk heb geschreven. Het eerste voorbeeld is hoe ik de prompt voor de toespraak van Lei Jun heb geschreven. Voordat je verder leest, stop even en denk na: hoe zou jij het schrijven? Ik deed het als volgt: Eerst verzamelde ik met Deep Research de toespraken van Lei Jun, en liet ik AI een prompt genereren die de toespraak van Lei Jun nabootst op basis van de resultaten van de AI. (Figuur 1) Nadat AI de prompt had gegenereerd, testte ik deze. Hoewel het een toespraak in de stijl van Lei Jun genereerde, was de inhoud tamelijk vlak en het resultaat was niet echt bevredigend. (Figuur 2) Ik testte dezelfde methode op ChatGPT en Claude, en de resultaten waren ook niet goed. Het lijkt erop dat de resultaten van Deep Research niet goed genoeg waren; veel waren waarschijnlijk geen toespraken van Lei Jun, maar gewoon nieuwsberichten. Later zag ik op X een post van een gebruiker die een samenvatting van de stijl van Lei Jun had gemaakt, dus besloot ik het te proberen: > Help me een prompt te genereren die een toespraak in de stijl van Lei Jun kan maken op basis van het ingevoerde onderwerp of de tekst. Hieronder is de samenvatting van de gebruiker als referentie: > \<tweet > > Lei Jun heeft een zeer indrukwekkende vaardigheid, namelijk het beschrijven van iets dat vrij gewoon of niet zo indrukwekkend is met cijfers, percentages of andere bijvoeglijke naamwoorden, zodat het klinkt als een onbereikbaar object. > Na de presentatie klaagden de leidinggevenden van Zeekr over de Xiaomi-auto: de marketing van Xiaomi is iets waar we van kunnen leren, maar op het gebied van autotechnologie zou Xiaomi van ons moeten leren. > Lei Jun's PPT heeft een gelijkaardige charme als de film dialogen van Wong Kar-wai. > Een voorbeeld: een gewone persoon zou zeggen dat hij een kom noedels bestelt, maar Lei Jun's PPT zou zeggen: "Na 300 dagen en nachten van ononderbroken big data-onderzoek door onze Xiaomi-medewerkers, blijkt dat 97% van de mensen om 07:03:56 een duidelijke honger voelt, vergeleken met 07:00, is de honger met 57% toegenomen." > Om deze honger, die de mensheid al duizenden jaren kwelt, op te lossen, hebben onze Xiaomi-ingenieurs herhaaldelijk onderzoek gedaan en ontdekt dat de verzadiging van tarwemeel 21% hoger is dan die van rijst. > Daarom hebben we de oorsprong van tarwe, de grondstof voor meel, 50.000 jaar geleden in het Midden-Oosten gevonden en hebben we veel geld geïnvesteerd in het ontwikkelen van de meest verzadigende noedels tot nu toe in de vruchtbare halve maan. > Hoe verzadigend zijn ze? De verzadiging is met 73% verhoogd in vergelijking met traditionele noedels. Tegelijkertijd is het caloriegehalte met 50% gedaald. > We hebben het ook een mooie naam gegeven: Xiaomi Super Holle Noedels. Daarnaast hebben we in samenwerking met de industrie-gigant voor drinkwater, Nongfu Spring, de eerste in de industrie ontwikkelde noedel-specifieke water - Nongfu Mi Quan. De noedels gekookt met ons Nongfu Mi Quan hebben een extra verhoging van 11% in verzadiging. > 9,9 yuan voor 3 kilo Xiaomi holle noedels met sterke verzadiging. (De kosten van het meel zijn slechts 1,6 yuan per kilo) Gratis tien zakken kruiden. In totaal zijn er 9 verschillende diktes en 6 verschillende verpakkingskleuren om uit te kiezen. > \</tweet> (Figuur 3) Na het testen met de gegenereerde prompt was het resultaat geweldig! Zo simpel is het!
Ik heb dit proces in een afbeelding weergegeven (Afbeelding 1) Alle promptcreatie is zo'n iteratief proces: 0. Doel: Stel eerst een doel vast, wat verwacht je dat je prompt zal bereiken? 1. Idee: Met een doel heb je een idee nodig over hoe je het moet schrijven, bijvoorbeeld handmatig schrijven, AI kan je helpen schrijven, of je kunt een sjabloon gebruiken. 2. Schrijf de prompt: Denk niet te veel na, schrijf eerst een versie. Het is net als oefenen met schieten, denk niet te veel na, richt en schiet. 3. Test de prompt: Nadat je de eerste versie van de prompt hebt, test je je prompt. 4. Beoordeling: Kijk na het ontvangen van de testresultaten hoe groot het verschil is tussen het werkelijke resultaat en het verwachte resultaat, en waar het verschil ligt. Het is net als wanneer je op een doel schiet en je meet hoe ver je van het midden van het doel af bent. Als de beoordelingsresultaten niet voldoen aan je vastgestelde doel, begin dan opnieuw bij stap 1 en blijf itereren op basis van de resultaten van de vorige versie. Soms heb je geluk en krijg je in één keer een goed resultaat, soms moet je meerdere keren itereren. Bijvoorbeeld, de laatste keer dat ik prompts voor het genereren van YouTube-ondertitels maakte, heb ik meer dan tien versies iteratief gemaakt. In het begin was ik niet tevreden over het formaat, later ontdekte ik dat het altijd tijdstempels in het midden van paragrafen toevoegde, wat de leeservaring erg beïnvloedde. Maar hoe ik ook probeerde in de prompt te benadrukken dat het geen tijdstempels in het midden van paragrafen moest toevoegen, het hielp niet. (Afbeelding 2) Uiteindelijk had ik een ingeving en voegde ik in het Few-Shot voorbeeld een geval toe waarin als dezelfde persoon te lange inhoud spreekt, het in twee delen wordt weergegeven. Eindelijk voegde het geen tijdstempels meer in de paragrafen toe. (Afbeelding 3) Dus om samen te vatten, veel mensen kunnen geen goede prompts schrijven, de kern is eigenlijk niet dat ze geen goede sjablonen kunnen vinden, of dat AI hen niet kan helpen, maar *kun je de huidige resultaten van de promptgeneratie evalueren ten opzichte van het doel, en weet je hoe je moet aanpassen?* Dit is ook de reden waarom prompts in professionele domeinen vaak een professionele achtergrond vereisen om goed te kunnen schrijven. Bijvoorbeeld, iemand die niet weet hoe te programmeren, kan AI niet goed laten programmeren, zelfs niet met een heleboel sjablonen, omdat ze niet kunnen beoordelen of de resultaten van de prompt aan de eisen voldoen, en als dat niet het geval is, waar het verschil ligt en hoe ze moeten aanpassen.
150,77K