"DIAMOND makalesi gerçekten ilginçti çünkü bu dünya modelini tüketici GPU'da çalıştırmayı başarmışlardı. Bu küçük veriyle oynanabilir bir şeye sahip olmaları inanılmazdı. Bu yüzden aslında tüm öğrenci grubuna soğuk e-posta attım. O zamanlar fark etmediğimiz şey, bu kadar çok veriye sahip olduğumuz için, bu dünya modellerini paralel olarak yapabildiğimiz, LLM bahisinin eşdeğerini alıp ardından dünya modellerini kullanarak gerçek anlamda RL'ye girebileceğimizdir." Pim, DIAMOND makalesine rastlamaktan (laboratuvarlar tarafından yaklaşılmasına ve sonra kendi verileriyle kendi işlerini yapmaya kadar) sürecini anlatıyor. @PimDeWitte