Je bent in een ML Engineer interview bij Stripe. De interviewer vraagt: "Mensen betwisten vaak transacties die ze daadwerkelijk hebben gedaan. Hoe bouw je een gemodelleerd systeem dat nep-betwistingen voorspelt? Er zijn geen gelabelde gegevens." Jij: "Ik zal kaarten met hoge betwistingspercentages markeren." Interview voorbij. Hier is wat je gemist hebt: Actief leren is een relatief gemakkelijke en goedkope manier om gemodelleerde systemen te bouwen wanneer je geen geannoteerde gegevens hebt om mee te beginnen. Zoals de naam al aangeeft, is het idee om het model te bouwen met actieve menselijke feedback op voorbeelden waar het moeite mee heeft. De afbeelding hieronder vat dit samen. 1) Begin met het handmatig labelen van een klein percentage van je gegevens. 2) Bouw een model op deze kleine gelabelde dataset. Dit zal geen goed model zijn, maar dat is prima. 3) Genereer vervolgens voorspellingen op de dataset die je niet hebt gelabeld. Aangezien de dataset niet gelabeld is, kunnen we niet bepalen of deze voorspellingen correct zijn. ...