Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Alle snakker om RL-miljøer. Og du er for redd til å spørre på dette tidspunktet, "hva er et RL-miljø"?
Tenk på det som en verden der en agent bor der den nåværende tilstanden, belønningene og målet er definert. Ny måte å skalere intelligens på.
Den vanskeligste delen av å definere RL-envs er å få konteksten og handlingene til å gi mening. For de fleste utøvere, som enhver ny teknologi, vil det ikke gjøre det.
Å definere observasjons-/handlingsrommet + belønningsfunksjonen er helt og holdent et dataanliggende... 👀
15,91K
Topp
Rangering
Favoritter