GSM8K zero-shot (benchmark de capacidad matemática del LLM core) Qwen 3 8b Base: 0.11 Qwen 3 8b Instruct: 0.59 Gradients Instruct 8b (partiendo de Qwen 3 8b base): 0.68 Sí, lo leíste bien. ¿Entrenamiento en Grads >> equipos de Qwen? ¡Anuncio completo en Novelty Search la próxima semana!
7,25K