Wszyscy mówią o środowiskach RL. A ty jesteś zbyt przestraszony, aby w tym momencie zapytać: "co to jest środowisko RL"? Pomyśl o tym jak o świecie, w którym żyje agent, gdzie zdefiniowany jest obecny stan, nagrody i cel. Nowy sposób na skalowanie inteligencji. Najtrudniejszą częścią definiowania środowisk RL jest sprawienie, aby kontekst i działania miały sens. Dla większości praktyków, jak w przypadku każdej nowej technologii, tak nie będzie. Definiowanie przestrzeni obserwacji/działań + funkcji nagrody to całkowicie kwestia danych... 👀
15,89K