Всі говорять про середовища РЛ. І ви занадто боїтеся, щоб запитати в цей момент: «Що таке середовище РЛ»? Думайте про це як про світ, де агент живе, де визначається поточний стан, нагороди та мета. Новий спосіб масштабування інтелекту. Найскладніша частина визначення RL envs полягає в тому, щоб надати контексту та діям сенс. Для більшості практиків, як і для будь-якої нової технології, цього не станеться. Визначення простору спостереження/дії + функції винагороди є повністю проблемою даних... 👀