随着互联网行业的高速发展,人们获取信息的方式越来越多,从主动获取信息逐渐变为被动接收信息,信息量也呈爆发式增长。因此,人们已经从信息匮乏时代进入信息“过载”时代。人们对信息获取的有效性和针对性的需求随之出现,推荐系统也应运而生。推荐系统就是互联网时代的一种信息检索工具,推荐系统的任务就是连接用户和信息,创造价值。
    推荐系统从20世纪90年代开始出现,逐渐成为一门独立的学科,并且在学术界和工业界应用中都取得了诸多成果。《推荐系统算法实践》主要讲解目前学术界和工业界的一些主流、常用的推荐方法和工具。
    首先从基础开始,介绍数学基础、具体的推荐系统,以及常用的推荐算法工具,包括目前主流的工具Sklearn、Spark MLlib、TensorFlow,并且介绍效率提升工具Zeppelin Notebook和Jupyter Notebook。
    黄美灵《推荐系统算法实践》PDF+源代码
    《推荐系统算法实践》PDF,290页,带书签目录,文字可以复制,黄美灵著,配套源代码。
    下载: https://pan.baidu.com/s/1Fa3ilB-SQJ8MWAyyCYSoCg
    提取码: nx39
    111.png

    书中涉及理论的部分,表述的感觉可以让没什么数学基础的人能够看懂,针对数学薄弱的工程师还是有益的。
    《推荐系统算法实践》主要讲解推荐系统中的召回算法和排序算法,以及各个算法在主流工具Sklearn、Spark、TensorFlow等中的实现和应用。《推荐系统算法实践》中本着循序渐进的原则进行讲解。首先,介绍推荐系统中推荐算法的数学基础,推荐算法的平台、工具基础,以及具体的推荐系统。其次,讲解推荐系统中的召回算法,主要包括基于行为相似的协同过滤召回和基于内容相似的Word2vec召回,并且介绍其在Spark、TensorFlow主流工具中的实现与应用。再次,讲解推荐系统中的排序算法,包括线性模型、树模型和深度学习模型,分别介绍逻辑回归、FM、决策树、随机森林、GBDT、GBDT+LR、集成学习、深度森林、DNN、Wide & Deep、DeepFM、YouTube推荐等模型的原理,以及其在Sklearn、Spark、TensorFlow主流工具中的实现与应用。最后,介绍推荐算法的4个实践案例,帮助进行工程实践和应用,并且介绍如何在Notebook上进行代码开发和算法调试,以帮助提升工作效率。
    222.png

    看了《文本上的算法深入浅出自然语言处理》前2章,如果相关的知识点懂的话,这本书是一个很好的梳理和总结,如果不懂的话呢,那就要去看“更原理性”的其他书了。与周志华的《机器学习》和《统计学习方法》这样的书比起来呢,本书不是通过公式讲算法/模型的原理,而是讲大概的流程及具体的实际应用示例,毕竟这本书不厚。
    《自然语言处理简明教程》很厚的书,有意发散能把一些处理思想写出来,第七章是重点看的,感觉这个部分还有非常多可做的,未来如果有人做出了规范,那么必然有大的进步。
    推荐《文本上的算法深入浅出自然语言处理(路彦雄)》PDF+《自然语言处理简明教程(冯志伟)》PDF
    推荐两本中文文本处理的经典书籍。
    《文本上的算法深入浅出自然语言处理(路彦雄)》PDF,212页,带目录,文字可以复制。
    《自然语言处理简明教程(冯志伟)》PDF,980页,带目录。
    下载: https://pan.baidu.com/s/13PUr5K_eJq-kyun9VsA3RA
    提取码: gb6e
    14799540-9afe376179361379.png
    自然语言处理需要语言学本体理论的支撑,反过来,语言学本体理论也可以从自然语言处理当中,受到很大启发。本书是冯志伟先生用较为易懂的语言写的自然语言处理的简明教程。冯先生不仅对自然语言处理很内行,还对西方语言学流派十分熟稔,对于语言本体的观察和分析也十分好!实在是难得。

    选择性地看了书中的部分章节,比如第9章隐马尔可夫模型是我感兴趣的。把向前算法和维特比算法解释地真是通俗易懂、超级详细。所以对我来说“简明”并不意义书很薄,相反这本书算是厚的了;它对算法的介绍不是浅尝辄止,相反以举例子的形式介绍得非常详细。我想第9章应该也参考了《speech and language processing》这本书吧。所以对一些算法看不懂的时候,可以翻翻这本书描述的算法。
    下载: https://pan.baidu.com/s/1n63OX4zgvOxi48qMygmNDw
    提取码: nnda
    14799540-cc2599b532a793ed.png
    至于其他一些章节,比如介绍语法啊、词法、语言背景啊……与技术不太相关了吧(可能是我还没到那种境界)。因为是想了解NLP在计算机 工程 实现上一些应用嘛,就略过不看了。
    结合多年学习和从事自然语言处理相关工作的经验,力图用生动形象的方式深入浅出地介绍自然语言处理的理论、方法和技术。本书抛弃掉繁琐的证明,提取出算法的核心,帮助读者尽快地掌握自然语言处理所必备的知识和技能。主要分两大部分。第一部分是理论篇,包含前3章内容,主要介绍一些基础的数学知识、优化理论知识和一些机器学习的相关知识。第二部分是应用篇,包含第4章到第8章,分别针对计算性能、文本处理的术语、相似度计算、搜索引擎、推荐系统、自然语言处理和对话系统等主题展开介绍和讨论。