Ești într-un interviu ML Engineer la Stripe. Intervievatorul întreabă: "Oamenii contestă adesea tranzacțiile pe care le-au făcut de fapt. Cum să construiești un model supravegheat care prezice disputele false? Nu există date etichetate." Tu: "Voi semnala cărțile cu rate mari de dispută." Interviul s-a încheiat. Iată ce ai ratat: Învățarea activă este o modalitate relativ ușoară și ieftină de a construi modele supravegheate atunci când nu aveți date adnotate pentru început. După cum sugerează și numele, ideea este de a construi modelul cu feedback uman activ pe exemplele cu care se luptă. Imaginea de mai jos rezumă acest lucru. 1) Începeți prin a eticheta manual un procent mic din datele dvs. 2) Construiți un model pe acest mic set de date etichetat. Acesta nu va fi un model bun, dar este în regulă. 3) Apoi, generați predicții pe setul de date pe care nu l-ați etichetat. Deoarece setul de date nu este etichetat, nu putem determina dacă aceste predicții sunt corecte. ...