[LLM量化] 深入理解大模型量化:GPTQ 原理解析接下来看这个比较经典的GPTQ,它的量化算法。从名字上也可以看到,它在我们前面的分类里面属于post training quantization,也就是不需要对模型做训练的。然后它是对任意的已经训练好的模型可以做量化。然后它是weight-only,也只对模型权重去做量化,那就没有static和dynamic的区别,而至于mapping type的话,它是属于uniform的,就是我量化的时候只要除以这个scale,然后做四舍五入到对应的这个整数值就可以。反量化的时候就是乘以这个scale对吧?对称和不对