Alle snakker om RL-miljøer. Og du er for redd til å spørre på dette tidspunktet, "hva er et RL-miljø"? Tenk på det som en verden der en agent bor der den nåværende tilstanden, belønningene og målet er definert. Ny måte å skalere intelligens på. Den vanskeligste delen av å definere RL-envs er å få konteksten og handlingene til å gi mening. For de fleste utøvere, som enhver ny teknologi, vil det ikke gjøre det. Å definere observasjons-/handlingsrommet + belønningsfunksjonen er helt og holdent et dataanliggende... 👀
15,91K