原文链接

入门阶段

1.快速看完:借用思维导图记录笔记. 先读<西瓜书>
2.视频课巩固: Coursera 的《Machine Learning》.认真做笔记,完成公式推导.
3.调包跑算法


进阶阶段

1.阅读<统计学习方法>(第二版),并以<统计学习方法>中的目录整理自己的知识体系,以<西瓜书为辅>,<统计学习方法>看到什么算法,就去<西瓜书>里面看一看
2.使用群体智慧:

  • 使用CSDN/知乎专业平台的高质量文章,一些论文,比如:吴信东的<数据挖掘十大算法>
  • Github上比较著名的<南瓜书>,是对<西瓜书>中公式推到的补充
  • 利用思维导图,完善自己笔记

要学会取舍,分清哪些算法需要看,哪些算法可以放一放.
3.进阶要学习到的阶段:

  • 对需要学习的算法,掌握其数学原理,学会公式推导,掌握算法的优缺点;
  • 对不需要学习的算法,了解算法的作用,使用场景;
  • 掌握算法细节,比如所SVM的SMO和核函数;K-means的调优与改进,如何确定K值,如何证明其收敛性;LR的参数更新方法,L1和L2两种正则化,参数求解如何优化等;

4.学习书本以外的常用算法


精通阶段

1.深入学习了解算法细节,对比各大算法差异;
2.学习算法在工业中的应用,看源代码;
3.看论文;
4.写博客;