Toată lumea vorbește despre mediile RL. Și ești prea speriat să întrebi în acest moment, "ce este un mediu RL"? Gândiți-vă la asta ca la o lume în care trăiește un agent, unde sunt definite starea actuală, recompensele și scopul. Un nou mod de a scala inteligența. Cea mai grea parte a definirii mediului RL este să facă contextul și acțiunile să aibă sens. Pentru majoritatea practicienilor, ca orice tehnologie nouă, nu se va întâmpla. Definirea spațiului de observație/acțiune + funcția de recompensă este în întregime o preocupare de date... 👀