Všichni mluví o prostředí RL. A vy se v tuto chvíli příliš bojíte zeptat: "Co je to prostředí RL"? Představte si to jako svět, kde žije agent, kde je definován aktuální stav, odměny a cíl. Nový způsob škálování inteligence. Nejtěžší částí definování RL envs je zajistit, aby kontext a akce dávaly smysl. Pro většinu praktiků, stejně jako pro každou novou technologii, nebude. Definování prostoru pro pozorování/akci + funkce odměny je zcela otázkou dat... 👀
15,92K