MNN FP16压缩工具

浏览 490 扫码分享 2023-04-16 15:12:07

原理

将模型中FP32权值转换为FP16存储，并在支持的设备上开启FP16推理，可以获得推理加速，并且速度减少到原来的1/2。可以在模型转换时一键完成，使用方便。

使用MNNConvert（c++）或者mnnconvert（python包中自带）进行转换，转换命令行中加上下述选项即可：

--fp16

若有收获，就点个赞吧

让时间为你证明