机器学习

深度学习


学习材料

  • Pang-Ning Tan-Introduction to Data Mining
  • han 数据挖掘
  • Advances in Knowledge Disco Part 1 + 2
  • Data Mining_ Practical Machine Learning Tools and Techniques
  • 数据挖掘中不少东西其实和机器学习是重合的,至于这两个东西有什么区别,可以看看这个回答:https://stats.stackexchange.com/questions/5026/what-is-the-difference-between-data-mining-statistics-machine-learning-and-ai
  • Principles of Data Mining(还没看)非常基本的数据挖掘入门书,讲了不少Association Rule的东西
  • Pang-Ning Tan的《数据挖掘导论》 最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐 Jiawei Han 老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。难易程度:中上。
  • Jiawei Han的《数据挖掘概念与技术》如果你有大毅力读完这本书,也只能获得一些零碎的概念的认识,很难上手实际的项目。
  • Ian H. Witten / Eibe Frank的《数据挖掘 实用机器学习技术》整本书的思想脉络也是尽可能的由易到难,从简单的模型入手扩展到现实生活中实际的算法问题
  • Advances in Knowledge Discovery and Data Mining_ 16th Pac
  • 《DataMining: Practical Machine Learning Tools and Techniques》,第二版,Witten著,介绍了机器学习的基本理论和实践方法,并提供了一个公开的数据挖掘工作平台Weka,算法部分介绍得很详细。
  • TOBY SEGARAN的《集体智慧编程》很适合希望了解数据挖掘技术的程序员一的缺点是不够深入,基本没有数学推导,而且不够全面,内容不够翔实。不过作为一本入门书这些缺点反而是帮助理解和入门的优点。
  • Matthew A. Russell的《社交网站的数据挖掘与分析》
  • 北京大学杨建武老师的课件 杨建武文本挖掘
  • 《数据挖掘技术——市场营销、销售与客户关系管理领域应用》 Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management
  • 集体智慧编程
  • 时间序列分析及应用 话题
  • 《机器学习实践》主要是讲解如何用Python的数据科学库来实践机器学习和深度学习,我只看了第一部分,也就是机器学习相关的内容,里面会涉及到使用Seaborn的模块进行特征工程、实现各种算法和Pipeline,也对常用机器学习算法有系统性、概括性的介绍,非常适合快速入门和上手。
  • 《统计学习方法》和《机器学习》两本书主要是算法的基本理论介绍,在完成前两项的学习之后,考虑到时间紧张,我主要是选择之前遇到的几种常见算法和模型评估方法过了一遍。
  • 《百面机器学习》是在群里被安利的一本书,写书的目的主要是帮助算法工程师,但里面和机器学习相关的问题都非常典型,在面试当中也很常见,适合看一看整理思路。

数据挖掘公开课

  • 学堂在线 数据挖掘:理论与算法(自主模式)
  • 数据挖掘