Вы на интервью на должность ML Engineer в Stripe. Интервьюер спрашивает: "Люди часто оспаривают транзакции, которые они действительно совершили. Как построить контролируемую модель, которая предсказывает ложные споры? Нет размеченных данных." Вы: "Я отмечу карты с высоким уровнем споров." Интервью окончено. Вот что вы пропустили: Активное обучение — это относительно простой и недорогой способ построить контролируемые модели, когда у вас нет аннотированных данных для начала. Как следует из названия, идея заключается в том, чтобы строить модель с активной обратной связью от человека по примерам, с которыми она испытывает трудности. Ниже представлена визуализация этого. 1) Начните с ручной разметки крошечного процента ваших данных. 2) Постройте модель на этом небольшом размеченном наборе данных. Это не будет хорошей моделью, но это нормально. 3) Затем сгенерируйте прогнозы на наборе данных, который вы не размечали. Поскольку набор данных не размечен, мы не можем определить, правильны ли эти прогнозы. ...