Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Wszyscy mówią o środowiskach RL. A ty jesteś zbyt przestraszony, aby w tym momencie zapytać: "co to jest środowisko RL"?
Pomyśl o tym jak o świecie, w którym żyje agent, gdzie zdefiniowany jest obecny stan, nagrody i cel. Nowy sposób na skalowanie inteligencji.
Najtrudniejszą częścią definiowania środowisk RL jest sprawienie, aby kontekst i działania miały sens. Dla większości praktyków, jak w przypadku każdej nowej technologii, tak nie będzie.
Definiowanie przestrzeni obserwacji/działań + funkcji nagrody to całkowicie kwestia danych... 👀
15,89K
Najlepsze
Ranking
Ulubione