你正在Stripe進行機器學習工程師的面試。 面試官問: 「人們經常對他們實際上進行的交易提出異議。 如何建立一個監督模型來預測虛假的異議? 沒有標記數據。」 你:"我會標記異議率高的卡片。" 面試結束。 你錯過了以下內容: 主動學習是一種相對簡單且便宜的方法,可以在沒有註釋數據的情況下建立監督模型。 顧名思義,這個想法是通過對模型在其掙扎的示例上進行主動的人類反饋來建立模型。 下面的視覺總結了這一點。 1) 首先手動標記你數據的一小部分。 2) 在這個小的標記數據集上建立模型。這不會是一個好的模型,但這沒關係。 3) 接下來,對你未標記的數據集生成預測。 由於數據集是未標記的,我們無法確定這些預測是否正確。 ...