Estás en una entrevista para Ingeniero de ML en Stripe. El entrevistador pregunta: "Las personas a menudo disputan transacciones que realmente realizaron. ¿Cómo construir un modelo supervisado que prediga disputas falsas? No hay datos etiquetados." Tú: "Marcaré las tarjetas con altas tasas de disputa." Entrevista terminada. Esto es lo que te perdiste: El aprendizaje activo es una forma relativamente fácil y económica de construir modelos supervisados cuando no tienes datos anotados para comenzar. Como su nombre indica, la idea es construir el modelo con retroalimentación humana activa sobre ejemplos con los que tiene dificultades. La visualización a continuación resume esto. 1) Comienza etiquetando manualmente un pequeño porcentaje de tus datos. 2) Construye un modelo sobre este pequeño conjunto de datos etiquetados. Este no será un buen modelo, pero está bien. 3) A continuación, genera predicciones sobre el conjunto de datos que no etiquetaste. Dado que el conjunto de datos no está etiquetado, no podemos determinar si estas predicciones son correctas. ...