Todo mundo está falando sobre ambientes RL. E você está com muito medo de perguntar neste momento: "o que é um ambiente RL"? Pense nisso como um mundo onde um agente vive, onde o estado atual, as recompensas e o objetivo são definidos. Nova maneira de dimensionar a inteligência. A parte mais difícil de definir envs RL é fazer com que o contexto e as ações façam sentido. Para a maioria dos profissionais, como qualquer nova tecnologia, isso não acontecerá. Definir a função de observação/ação espaço + recompensa é inteiramente uma preocupação de dados... 👀
15,93K