模型压缩 发表于 2022-07-11 | 模型压缩常用方法 模型裁剪:网络中不需要的权重进行修剪,包括非结构化裁剪/结构化裁剪 模型量化:用uint8之类的低bit数域来映射和还原f32的浮点权重 知识蒸馏:teacher student,利用soft label 网络结构设计:MobileNet、ShuffleNet 模型裁剪 非结构化裁剪 裁剪掉某些不重要的神经元实现 裁剪力度较大,可以压缩几十倍 需要定制化的软硬件支持 结构化裁剪 channel、filter、shape的re-selection 灵活部署