让我们一起量化一个真实的例子。 🧮 从权重开始:[0.1, -0.5, 2.3, -1.8] 在 float32 中 → 16 字节。 目标:缩小到 int8(仅 4 字节)。 怎么做?两个魔法数字:scale 和 zero_point。 🔑 一步一步 👇
363