1. Introduction
| Conferences:
ICLR 2016 |
---|
Author: |
| Song Han、Huizi Mao、William J. Dally
| | Year:
| 2016
| | ISBNs, DOls, PMIDs, or arXiv IDs:
| | Cite:
| arXiv:1510.00149cs.CV[cs.CV] for this version)https://doi.org/10.48550/arXiv.1510.00149
| | Reportor:
| 孙百乐 | | Attachment:
|
2. Figures
3. Summary
神经网络在移动端的应用非常广泛,但是移动端的存储大小有限,能耗也是expensive的,所以要对网络进行压缩。本文和提出了三步压缩方法,分别是“剪枝”、“量化”、“Huffman编码”,其对网络的压缩效果很好,而且能够保持原有的精度。
4. Main Points
1. 剪枝:去除弱连接
- 量化:权重共享,以减少权重表达数量
- Huffman编码:编码压缩