模型压缩

模型压缩常用方法

  1. 模型裁剪:网络中不需要的权重进行修剪,包括非结构化裁剪/结构化裁剪
  2. 模型量化:用uint8之类的低bit数域来映射和还原f32的浮点权重
  3. 知识蒸馏:teacher student,利用soft label
  4. 网络结构设计:MobileNet、ShuffleNet
  1. 模型裁剪
    • 非结构化裁剪
      • 裁剪掉某些不重要的神经元实现
      • 裁剪力度较大,可以压缩几十倍
      • 需要定制化的软硬件支持
    • 结构化裁剪
      • channel、filter、shape的re-selection
      • 灵活部署