文本处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的多个方面,包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。《驾驭文本:文本的发现组织和处理》的特点在于通过实例来理解文本处理的这些概念和技术,读者利用现有的开源工具就可以自己实现这些实例。
《驾驭文本:文本的发现组织和处理》中文PDF,342页,带书签目录,文字可以复制。
《驾驭文本:文本的发现组织和处理》英文PDF,322页,带书签目录,文字可以复制。
配套源代码。
下载: https://pan.baidu.com/s/1Uarrs6bt4z7xvEdHWefXzA
提取码: t4eh
其他《精通Python自然语言处理》等资料:
下载: https://pan.baidu.com/s/1n63OX4zgvOxi48qMygmNDw
提取码: nnda
《基于深度学习的自然语言处理》中文PDF+英文PDF+Yoav Goldberg
《基于深度学习的自然语言处理》中文PDF,274页,带书签目录,文字可以复制。
《基于深度学习的自然语言处理》英文PDF,282页,带书签目录,文字可以复制。
下载: https://pan.baidu.com/s/1v05L521Xr9le0IQCE7f6VA
提取码: 33ku
自然语言处理是人工智能领域的一个重要的研究方向,是计算机科学与语言学的交叉学科。随着互联网的快速发展,网络文本尤其是用户生成的文本呈爆炸性增长,为自然语言处理带来了巨大的应用需求。但是由于自然语言具有歧义性、动态性和非规范性,同时语言理解通常需要丰富的知识和一定的推理能力,为自然语言处理带来了极大的挑战。