自然语言处理NLP是计算机科学、人工智能、语言学关注计算机和人类(自然)语言之间的相互作用的领域。自然语言处理是机器学习的应用之一,用于分析、理解和生成自然语言,它与人机交互有关,最终实现人与计算机之间更好的交流。
正是NLP在我们日常生活中呈现出越来越多的便利性,才更想对NLP背后的模型原理和具体应用进行深入的探讨,以便我们对NLP有更多的认知。查看了近些年来的相关文献,发现单独讲解NLP方面的理论文献国内外都有,单独撰写NLP任务实现的技术工具(如TensorFlow)的图书也很多,而将二者结合起来的图书,目前在国内还没有发现,学会如何利用深度学习来实现许多有意义的NLP任务。具体的代码实现(含实现过程),使用的技术框架为TensorFlow(1.8版本),编程语言为Python(3.6版本)。
《TensorFlow与自然语言处理应用》PDF,414页,有目录,文字可复制;配套源代码。作者: 李孟全
下载: https://pan.baidu.com/s/12iagygRiaSQ_uqINnma4Hw
提取码: shfq
《TensorFlow与自然语言处理应用》分为12章,内容包括自然语言处理基础、深度学习基础、TensorFlow、词嵌入(Word Embedding)、卷积神经网络(CNN)与句子分类、循环神经网络(RNN)、长短期记忆(LSTM)、利用LSTM实现图像字幕自动生成、情感分析、机器翻译及智能问答系统。
深度学习的优点是可以将所有文本跨度(包括文档、问题和潜在答案)转换为向量嵌入,然而基于深度学习的QA模型存在许多挑战。例如,现有的神经网络(RNN和CNN)仍然不能精确地捕获给定问题的语义含义,特别是对于文档,主题或逻辑结构不能通过神经网络容易地建模,并且在知识库中嵌入项目仍然没有有效的方法,以及QA中的推理过程很难通过向量之间的简单数值运算来建模。这些问题是质量保证任务面临的主要挑战,未来应引起更多的关注。
下载: https://pan.baidu.com/s/1n63OX4zgvOxi48qMygmNDw
提取码: nnda
如果学习中文自然语言处理,建议看看《NLP汉语自然语言处理原理与实践》。 全篇下来感觉到前后的行文逻辑的完整性,应该是一人完成,每章的开头和结尾是思维的发光点,起承转合,懂得知识结构是怎样耦合的。
研究汉语自然语言处理方面的基础性、综合性书籍,涉及NLP的语言理论、算法和工程实践的方方面面,内容繁杂。包括NLP的语言理论部分、算法部分、案例部分,涉及汉语的发展历史、传统的句法理论、认知语言学理论。迄今为止第一本系统介绍认知语言学和算法设计相结合的中文NLP书籍,并从认知语言学的视角重新认识和分析了NLP的句法和语义相结合的数据结构。
学习参考《NLP汉语自然语言处理原理与实践(郑捷著)》PDF+源代码
《NLP汉语自然语言处理原理与实践》PDF,547页,带书签目录。配套源代码。郑捷 著。
下载: https://pan.baidu.com/s/1t5nKm0Nb_XPGS514iq0dJQ
提取码: vse5