Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Todo el mundo está hablando sobre los entornos de RL. Y tú estás demasiado asustado para preguntar en este punto, "¿qué es un entorno de RL?"
Piénsalo como un mundo donde vive un agente, donde se definen el estado actual, las recompensas y el objetivo. Una nueva forma de escalar la inteligencia.
La parte más difícil de definir los entornos de RL es hacer que el contexto y las acciones tengan sentido. Para la mayoría de los practicantes, como con cualquier nueva tecnología, no lo tendrá.
Definir el espacio de observación/acción + la función de recompensa es completamente una preocupación de datos... 👀
15,91K
Parte superior
Clasificación
Favoritos