Semua orang berbicara tentang lingkungan RL. Dan Anda terlalu takut untuk bertanya pada titik ini, "apa itu lingkungan RL"? Anggap saja seperti dunia di mana seorang agen tinggal di mana keadaan, penghargaan, dan tujuan saat ini ditentukan. Cara baru untuk menskalakan kecerdasan. Bagian tersulit dari mendefinisikan RL envs adalah membuat konteks dan tindakan masuk akal. Bagi sebagian besar praktisi, seperti teknologi baru lainnya, itu tidak akan terjadi. Mendefinisikan ruang pengamatan/tindakan + fungsi hadiah sepenuhnya merupakan masalah data... 👀
15,9K