欢迎关注我的公众号 [极智视界],获取我的更多经验分享
大家好,我是极智视界,本文来介绍一下 解读深度学习PTQ后量化算法系列。
邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码下载,链接:https://t.zsxq.com/0aiNxERDq
之前陆续输出过一些 PTQ 后量化算法的讲解分享,会涉及十余篇,这里进行一个系列汇总,方便系统地展现给同样对模型小型化感兴趣的朋友。
一般所说的量化算法主要包括后量化 (PTQ) 和 量化感知训练 (QAT),对于工程部署来说,PTQ 往往会是首选,这是因为它的高效 (训练部署解耦)、简单,但是当部署要求提高的时候,比如要求量化误差更加小、比如要求要更低比特的量化时,那就要倾向推 QAT 了。
由于之前我输出的量化算法解读,大部分还是属于面向高效部署的 PTQ 量化,所以这里主要是 PTQ 量化算法的系列汇总。当然,你如果是对 QAT 感兴趣的话,