统计学习方法 - 图1

    关键字:统计学习,模型,策略,算法,监督学习,分类问题

    推荐:★★
    难度:★★★

    豆瓣链接:https://book.douban.com/subject/10590856/


    本书是一本数学书,
    是在知乎上,某位大神与《集体智慧编程》一同推荐的,
    可以作为上一本书的理论基础。

    本书开篇,学术味道很纯正,
    使用了严谨的态度描述统计学习这个庞大主题,
    提出了统计学习的三要素,模型+策略+算法。

    主要思路如下,首先对问题建模,
    然后使用一定的策略选取最优模型,
    最后转换为一个步骤性的算法问题。

    按照这个套路,
    可以对各种杂乱的方法进行统一,
    时刻知道自己当前处在哪个维度。

    本书区分了监督学习,非监督学习,半监督学习,强化学习。
    区分了生成模型,判别模型。
    区分了分类问题,标注问题,回归问题。
    给人一种清晰透彻的感觉。

    随后的每一章,分别介绍一种统计学习方法,
    感知机,k近邻法,朴素贝叶斯法,
    决策树,逻辑斯谛回归与最大熵模型,
    支持向量机,提升方法,EM算法,
    隐马尔可夫模型,条件随机场。

    它们各自都有适用的场景,
    逐一进行数学化的论证和推导,
    介绍每一个方法的由来和局限性。

    不足之处可能在于,
    本来数学书的可读性就远不如它的参考性,
    有些人可能对数学不太感兴趣,
    很多严格的推导我也没有跟进,
    只是看了一下思路和结果。

    总体看来,
    本书可以看做一个200多页的数学基础附录,
    随时阅读,查漏补缺。

    机器学习领域,真是博大精深,
    稍微深入下去,可能又要度过十年时间了。