Kerasでは、わずか1行のコードでモデルを量子化できるようになりました。 独自のモデルまたはKerasHubから取得した事前トレーニング済みモデルを量子化できます。 model.quantize(quantization_mode)を実行するだけです。 int4、int8、float8、GPTQ モードへの量子化をサポートします。