Den beste måten å lære om AI-evalueringer på er å se 2 PM-er bygge dem live fra bunnen av. I morgen går @_amankhan og jeg gjennom å lage evalueringer for en AI-kundestøtteagent, inkludert: ✅ Definere evalueringskriteriene ✅ Merking av et gyllent datasett ✅ Spørsmål om justering av LLM-dommer Vi brukte Anthropic Console, Arize AI og det kraftigste verktøyet som noen gang er oppfunnet - regnearket 😅 Dette er det komplette AI-evalkurset for nybegynnere du har ventet på. 📌 Abonner for å få det tmr:
5,57K