O Keras agora permite quantizar modelos com apenas uma linha de código! Você pode quantizar seus próprios modelos ou qualquer modelo pré-treinado obtido do KerasHub. Basta executar model.quantize(quantization_mode). Suporta quantização para modos int4, int8, float8 e GPTQ.