• 集成算法
  • 一个分类器表现比较好,多个分类器结合

    算法原理

    image.png

  • 不是随便添加分类器,而是要保证每添加一个,分类结果要更好一点

image.png

  • 决策树的叶子节点树越多,越容易过拟合,因此需要通过惩罚项抑制

image.png
image.png

image.png

  • 搜索 xgboost

image.png

  • 下载,whl文件
  • 使用AnacondaPrompt进入安装包所在目录

pip install xgboost....whl

Python实现

单次预测

image.png
image.png

重复预测

image.png

  • 使用eval_set函数每加入一个模型就进行测试
  • early_stopping_rounds指定停止条件(连续10次没有提升就停下训练)
  • eval_metric指定目标的评估标准
  • eval_set指定测试集
  • verbose设置每加入模型都要在测试集中测试

image.png
image.png

特征重要性

  • 需要导入plot_importance模块

image.png
image.png

参数调节

image.png
image.png

  • 常用参数

image.png
image.png