Bu yılın en sevdiğim makale🤯 olabilir Rich Sutton, mevcut RL yöntemlerinin bizi sürekli öğrenmeye götürmeyeceğini çünkü önceki bilgiye dayanmadığını, her uygulamanın sıfırdan başladığını iddia ediyor. İsviçre'deki araştırmacılar, bu kodu çözebilecek Meta-RL tanıtıyor. Bölümler arasında optimize edin ve bir meta-öğrenme hedefi var; bu da ajanları önce keşfetmeye, sonra ise kullanmaya teşvik eder. Ve sonra gelecekteki ajan çalışmaları için önceki başarısızlıkları düşünün. Genel olarak inanılmaz sonuçlar ve inanılmaz bir makale okuması. Yazarlar: @YulunJiang @LiangzeJ @DamienTeney @Michael_D_Moor @mariabrbic