Environment Hub av prime-intellect er fantastisk med sine GUI-er!
Skalering av miljøer er nøkkelen – de gir signalene RL-agenter lærer av.
Vi har bygget 💎GEM med fellesskapet:
🌎Envs: matematikk, kode, spill med python/søkeverktøy
🔧Rammeverk-agnostisk: 5 integrerte rammeverk
Jeg har utviklet miljøer den siste uken. Jeg tror dette kan fikse RL-miljøbehovene til massene. Det har vært mange interessante, kule ting å teste ut, inkludert StepRunProver-inspirert Lean4-prøvetrykk med flere svinger jeg har laget.