《Python文本分析》遵循结构化和综合性的方法,介绍了文本和语言语法、结构和语义的基础概念和高级概念。从自然语言和Python的基础开始,进而学习先进的分析理念和机器学习概念。
全面提供了自然语言处理(NLP)和文本分析的主要概念和技术。包含了丰富的真实案例实现技术,例如构建分类新闻文章的文本分类系统,使用主题建模和文本摘要分析app或游戏评论,进行热门电影概要的聚类分析和电影评论的情感分析。介绍了基于Python和流行NLP开源库和文本分析实用工具,如自然语言工具包nltk、gensim、scikit-learn、spaCy和Pattern。
学习参考:
《Python文本分析》中文PDF,285页,文字可以复制。
《Python文本分析》英文PDF,397页,文字可以复制。
配套源代码。作者: [印] 迪潘简·撒卡尔
下载: https://pan.baidu.com/s/1s30LJMsOJyk6sdHatqqVOQ
提取码: tyn2
涉及的主要内容有第1章自然语言基础,第2章Python语言,第3章处理和理解文本,第4章文本分类。
第5章文本摘要,第6章文本相似度和聚类,第7章语义与情感分析,包括语义分析、探索WordNet、词义消歧、命名实体识别、分析语义表征、情感分析、IMDb电影评论的情感分析等内容。
《Python自然语言处理》中文PDF,631页,有目录,文字可复制;英文PDF,468页,有目录,文字可复制;配套源代码。作者: [印] 雅兰·萨纳卡Jalaj Thanaki,译者: 张金超 / 刘舒曼
下载: https://pan.baidu.com/s/1bTObRcW8p7Q0WA15_O-S0g
提取码: qy3k
学习Python自然语言处理旨在回答三个问题:第一个,什么是自然语言处理;第二个,为什么大多数人会使用Python来开发自然语言处理应用程序;最后一个也很重要的问题,在学习自然语言处理的时候,有哪些Python相关资源可用。
nlp自然语言处理系列
下载: https://pan.baidu.com/s/1n63OX4zgvOxi48qMygmNDw
提取码: nnda
刚好学到word2vec,偶然发现一篇论文特别好但却用的是《Python自然语言处理》word2vec章节里面的一个例子,而且Jalaj Thanaki讲得更细致,然后就开始从这本书看起,真的给了我一个广泛开阔的视角去看待NLP(“开阔”相较于之间花大量的时间收效的狭窄的认知眼界),我觉得此刻我才明白NLP的任务、目标、概念、技术面横向上的大概,以及认知NLP基本的实现手法和起手一个项目时人的思路。这些,我真的觉得比我之前花两个月读完深度学习和漫长的时间在cs224上迷雾里折腾,有意思也有意义得多太多了!这本书讲得其实很浅,对于业界人士,但对于我这种入门级的孩子来说,真的这本书节省了我很多时间和给我很大的信心支持。所用代码的工具和框架是nltk和tensorflow、keras,我希望用pytorch,和中文的NLP环境,但显然遗憾让我更快得将它当作一种普识去尽快阅读完毕,然后进入另外一片世界的汉语中。