Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Iedereen heeft het over RL-omgevingen. En je bent op dit punt te bang om te vragen: "wat is een RL-omgeving"?
Zie het als een wereld waar een agent leeft waar de huidige staat, beloningen en doelstellingen zijn gedefinieerd. Een nieuwe manier om intelligentie op te schalen.
Het moeilijkste deel van het definiëren van RL-omgevingen is ervoor te zorgen dat de context en acties logisch zijn. Voor de meeste beoefenaars, zoals bij elke nieuwe technologie, zal dat niet het geval zijn.
Het definiëren van de observatie-/actie-ruimte + beloningsfunctie is volledig een datavraag... 👀
15,92K
Boven
Positie
Favorieten