Ви проходите співбесіду з ML Engineer у Stripe. Інтерв'юер запитує: «Люди часто оскаржують транзакції, які вони насправді здійснили. Як побудувати контрольовану модель, яка передбачає фальшиві суперечки? Немає жодних мічених даних». Ви: «Я буду позначати карти з високим рівнем суперечок». Інтерв'ю закінчено. Ось що ви пропустили: Активне навчання є відносно простим і недорогим способом побудови контрольованих моделей, коли у вас немає анотованих даних для початку. Як випливає з назви, ідея полягає в тому, щоб побудувати модель з активним зворотним зв'язком з людьми на прикладах, з якими вона бореться. Наведений нижче малюнок резюмує це. 1) Почніть з ручного позначення невеликого відсотка ваших даних. 2) Побудуйте модель на цьому невеликому міченому наборі даних. Це не буде хороша модель, але це нормально. 3) Далі створіть прогнози на наборі даних, який ви не позначили. Оскільки набір даних не позначений, ми не можемо визначити, чи правильні ці прогнози. ...