Estás en una entrevista de ingeniero de ML en Stripe. El entrevistador pregunta: "La gente a menudo disputa las transacciones que realmente hicieron. ¿Cómo construir un modelo supervisado que prediga disputas falsas? No hay datos etiquetados". Tú: "Marcaré cartas con altas tasas de disputa". Entrevista terminada. Esto es lo que te perdiste: El aprendizaje activo es una forma relativamente fácil y económica de crear modelos supervisados cuando no tiene datos anotados para empezar. Como su nombre indica, la idea es construir el modelo con retroalimentación humana activa sobre los ejemplos con los que está luchando. La siguiente imagen resume esto. 1) Comience etiquetando manualmente un pequeño porcentaje de sus datos. 2) Construya un modelo en este pequeño conjunto de datos etiquetado. Este no será un buen modelo, pero está bien. 3) A continuación, genere predicciones en el conjunto de datos que no etiquetó. Dado que el conjunto de datos no está etiquetado, no podemos determinar si estas predicciones son correctas. ...