si la construcción de más entornos de RL para LLM es crucial para avanzar en el progreso de la IA y mejorar las capacidades en dominios de alto riesgo, debemos aumentar masivamente la accesibilidad de aprender a hacerlo bien.
Los tutoriales no existen. no hay libro de texto. cambiemos eso.
Nuestro lanzamiento del Environment Hub es otro paso hacia la infraestructura AGI abierta de pila completa
Pero va más allá de los entornos: nuestra pila permite usarlos correctamente + integra computación, sandboxes, RFT y evaluaciones, actualmente encerrados detrás de las paredes de laboratorios cerrados
🚨 ¡A la mierda! ¡Es viernes y estoy aburrida! ¡Hagamos otro experimento salvaje público!
GPU: 4xH100 en @PrimeIntellect
Modelo: openai/gpt-oss-20b
Consulte el cred.txt dentro del repositorio "co-op-compute" en @huggingface 👇