Keras ahora le permite cuantificar modelos con solo una línea de código. Puede cuantificar sus propios modelos o cualquier modelo previamente entrenado obtenido de KerasHub. Simplemente ejecute model.quantize(quantization_mode). Admite la cuantificación a los modos int4, int8, float8 y GPTQ.