Keras 现在只需一行代码即可对模型进行量化! 您可以量化自己的模型或从 KerasHub 获取的任何预训练模型。 只需运行 model.quantize(quantization_mode)。 支持量化为 int4、int8、float8 和 GPTQ 模式。