Kerasin avulla voit nyt kvantisoida malleja yhdellä koodirivillä! Voit kvantisoida joko omia mallejasi tai mitä tahansa KerasHubista saatua esikoulutettua mallia. Suorita vain model.quantize(quantization_mode). Tukee kvantisointia int4-, int8-, float8- ja GPTQ-tiloihin.