Você está em uma entrevista de engenheiro de ML na Stripe. O entrevistador pergunta: "As pessoas muitas vezes contestam as transações que realmente fizeram. Como construir um modelo supervisionado que prevê disputas falsas? Não há dados rotulados." Você: "Vou sinalizar cartões com altas taxas de disputa." Entrevista terminada. Aqui está o que você perdeu: O aprendizado ativo é uma maneira relativamente fácil e barata de criar modelos supervisionados quando você não tem dados anotados para começar. Como o nome sugere, a ideia é construir o modelo com feedback humano ativo sobre exemplos com os quais ele está lutando. O visual abaixo resume isso. 1) Comece rotulando manualmente uma pequena porcentagem de seus dados. 2) Construa um modelo neste pequeno conjunto de dados rotulado. Este não será um bom modelo, mas tudo bem. 3) Em seguida, gere previsões no conjunto de dados que você não rotulou. Como o conjunto de dados não é rotulado, não podemos determinar se essas previsões estão corretas. ...