入门阶段
1.快速看完:借用思维导图记录笔记. 先读<西瓜书>
2.视频课巩固: Coursera 的《Machine Learning》.认真做笔记,完成公式推导.
3.调包跑算法
进阶阶段
1.阅读<统计学习方法>(第二版),并以<统计学习方法>中的目录整理自己的知识体系,以<西瓜书为辅>,<统计学习方法>看到什么算法,就去<西瓜书>里面看一看
2.使用群体智慧:
- 使用CSDN/知乎专业平台的高质量文章,一些论文,比如:吴信东的<数据挖掘十大算法>
- Github上比较著名的<南瓜书>,是对<西瓜书>中公式推到的补充
- 利用思维导图,完善自己笔记
要学会取舍,分清哪些算法需要看,哪些算法可以放一放.
3.进阶要学习到的阶段:
- 对需要学习的算法,掌握其数学原理,学会公式推导,掌握算法的优缺点;
- 对不需要学习的算法,了解算法的作用,使用场景;
- 掌握算法细节,比如所SVM的SMO和核函数;K-means的调优与改进,如何确定K值,如何证明其收敛性;LR的参数更新方法,L1和L2两种正则化,参数求解如何优化等;
4.学习书本以外的常用算法
精通阶段
1.深入学习了解算法细节,对比各大算法差异;
2.学习算法在工业中的应用,看源代码;
3.看论文;
4.写博客;