Per spingere l'avanguardia open source per RL + LLM, abbiamo bisogno di ambienti scalabili e modulari con complessità del mondo reale, oltre ai benchmark matematici. Oggi, stiamo rilasciando *benchmax*. Un framework open-source per costruire, eseguire e scalare ambienti RL utili per il fine-tuning di LLM, con integrazioni a verl e verificatori (altre in arrivo presto!).
10,62K