关键字:统计学习,模型,策略,算法,监督学习,分类问题
推荐:★★
难度:★★★
豆瓣链接:https://book.douban.com/subject/10590856/
本书是一本数学书,
是在知乎上,某位大神与《集体智慧编程》一同推荐的,
可以作为上一本书的理论基础。
本书开篇,学术味道很纯正,
使用了严谨的态度描述统计学习这个庞大主题,
提出了统计学习的三要素,模型+策略+算法。
主要思路如下,首先对问题建模,
然后使用一定的策略选取最优模型,
最后转换为一个步骤性的算法问题。
按照这个套路,
可以对各种杂乱的方法进行统一,
时刻知道自己当前处在哪个维度。
本书区分了监督学习,非监督学习,半监督学习,强化学习。
区分了生成模型,判别模型。
区分了分类问题,标注问题,回归问题。
给人一种清晰透彻的感觉。
随后的每一章,分别介绍一种统计学习方法,
感知机,k近邻法,朴素贝叶斯法,
决策树,逻辑斯谛回归与最大熵模型,
支持向量机,提升方法,EM算法,
隐马尔可夫模型,条件随机场。
它们各自都有适用的场景,
逐一进行数学化的论证和推导,
介绍每一个方法的由来和局限性。
不足之处可能在于,
本来数学书的可读性就远不如它的参考性,
有些人可能对数学不太感兴趣,
很多严格的推导我也没有跟进,
只是看了一下思路和结果。
总体看来,
本书可以看做一个200多页的数学基础附录,
随时阅读,查漏补缺。
机器学习领域,真是博大精深,
稍微深入下去,可能又要度过十年时间了。