Du er i et ML Engineer-intervju hos Stripe. Intervjueren spør: «Folk bestrider ofte transaksjoner de faktisk har gjort. Hvordan bygge en overvåket modell som forutsier falske tvister? Det er ingen merkede data.» Du: «Jeg flagger kort med høy tvistefrekvens.» Intervjuet er over. Her er hva du gikk glipp av: Aktiv læring er en relativt enkel og rimelig måte å bygge overvåkede modeller på når du ikke har kommenterte data til å begynne med. Som navnet antyder, er ideen å bygge modellen med aktiv menneskelig tilbakemelding på eksempler den sliter med. Visualobjektet nedenfor oppsummerer dette. 1) Begynn med å merke en liten prosentandel av dataene dine manuelt. 2) Bygg en modell på dette lille merkede datasettet. Dette vil ikke være en god modell, men det er greit. 3) Deretter genererer du spådommer på datasettet du ikke har merket. Siden datasettet er umerket, kan vi ikke avgjøre om disse spådommene er riktige. ...