Todo el mundo está hablando sobre los entornos de RL. Y tú estás demasiado asustado para preguntar en este punto, "¿qué es un entorno de RL?" Piénsalo como un mundo donde vive un agente, donde se definen el estado actual, las recompensas y el objetivo. Una nueva forma de escalar la inteligencia. La parte más difícil de definir los entornos de RL es hacer que el contexto y las acciones tengan sentido. Para la mayoría de los practicantes, como con cualquier nueva tecnología, no lo tendrá. Definir el espacio de observación/acción + la función de recompensa es completamente una preocupación de datos... 👀
15,91K