Alla pratar om RL-miljöer. Och du är för rädd för att fråga vid det här laget, "vad är en RL-miljö"? Tänk på det som en värld där en agent bor där det aktuella tillståndet, belöningarna och målet definieras. Nytt sätt att skala intelligens. Den svåraste delen av att definiera RL-miljöer är att få sammanhanget och åtgärderna att bli begripliga. För de flesta utövare, som all ny teknik, kommer det inte att göra det. Att definiera observations-/handlingsutrymmet + belöningsfunktionen är helt och hållet en fråga om data... 👀
15,91K