1. Introduction

    | Conferences:

    ICLR 2016
    Author:

    | Song Han、Huizi Mao、William J. Dally

    | | Year:

    | 2016

    | | ISBNs, DOls, PMIDs, or arXiv IDs:

    |
    arXiv:1510.00149v5

    | | Cite:

    | arXiv:1510.00149cs.CV[cs.CV] for this version)https://doi.org/10.48550/arXiv.1510.00149

    | | Reportor:

    | 孙百乐 | | Attachment:

    | pdf

    |

    2. Figures
    image.png

    3. Summary
    神经网络在移动端的应用非常广泛,但是移动端的存储大小有限,能耗也是expensive的,所以要对网络进行压缩。本文和提出了三步压缩方法,分别是“剪枝”、“量化”、“Huffman编码”,其对网络的压缩效果很好,而且能够保持原有的精度。
    4. Main Points
    1. 剪枝:去除弱连接

    1. 量化:权重共享,以减少权重表达数量
    2. Huffman编码:编码压缩

    网络压缩.pptx