Mọi người đang nói về các môi trường RL. Và bạn quá sợ hãi để hỏi vào lúc này, "môi trường RL là gì"? Hãy nghĩ về nó như một thế giới nơi một tác nhân sống, nơi trạng thái hiện tại, phần thưởng và mục tiêu được xác định. Một cách mới để mở rộng trí thông minh. Phần khó nhất trong việc định nghĩa các môi trường RL là làm cho ngữ cảnh và hành động có ý nghĩa. Đối với hầu hết các nhà thực hành, giống như bất kỳ công nghệ mới nào, điều này sẽ không có ý nghĩa. Việc định nghĩa không gian quan sát/hành động + hàm phần thưởng hoàn toàn là một mối quan tâm về dữ liệu... 👀
15,92K