Iedereen heeft het over RL-omgevingen. En je bent op dit punt te bang om te vragen: "wat is een RL-omgeving"? Zie het als een wereld waar een agent leeft waar de huidige staat, beloningen en doelstellingen zijn gedefinieerd. Een nieuwe manier om intelligentie op te schalen. Het moeilijkste deel van het definiëren van RL-omgevingen is ervoor te zorgen dat de context en acties logisch zijn. Voor de meeste beoefenaars, zoals bij elke nieuwe technologie, zal dat niet het geval zijn. Het definiëren van de observatie-/actie-ruimte + beloningsfunctie is volledig een datavraag... 👀
15,92K