前言
最近使用spark-ml做数据模型训练,考虑到怎么把模型部署到线上环境。本尝试spring-boot启动spark-local模式预测,发现线上预测需要200ms~300ms,耗时太多。所以考虑把spark模型转换为pmml格式。我的spark集群版本为2.4.5
解决方案
使用jpmml-sparkml-executable生成PMML模型文件
官网:https://github.com/jpmml/jpmml-sparkml#documentation
部分样例:https://my.oschina.net/kyo4321/blog/2878932
其他
