layout: post # 使用的布局(不需要改)
title: 自然语言处理必备知识整理 # 标题
subtitle: 自然语言处理必备知识整理 #副标题
date: 2019-01-01 # 时间
author: NSX # 作者
header-img: img/post-bg-2015.jpg #这篇文章标题背景图片
catalog: true # 是否归档
tags: #标签

  • NLP

自然语言处理必备知识整理

入门

机器学习、深度学习、强化学习……刚入门的你是不是觉得这些概念很难区分?仔细读以下几篇文章,迈出 AI 之路第一步:

数学知识

数学在机器学习中非常重要,不论是在算法上理解模型代码,还是在工程上构建系统,数学都必不可少。2018 年,机器之心发布了多位「独秀同学」本着「再看不懂就 sǐ给你看」的态度写的数学知识解读,帮你完成从入门到精通(不放弃)的进阶之路。

教材/课程

当然,要成功入门 AI,读几篇文章、掌握一点碎片知识是远远不够的,以下课程、教材帮你系统梳理了入门所需的基础知识。

读论文

学完了入门课程,是时候读一些论文了。但论文那么多,究竟怎么读?这里有两篇文章帮你解锁读论文的正确姿势。

实战

实战开始!Are you ready?

语言

Python

随着机器学习的兴起,Python 逐步成为了「最受欢迎」的语言。它简单易用、逻辑明确并拥有海量的扩展包,因此其不仅成为机器学习与数据科学的首选语言,同时在网页、数据爬取可科学研究等方面成为不二选择。此外,很多入门级的机器学习开发者都是随大流选择 Python(参见《人生苦短,为什么我要用 Python?》)。Stack Overflow 将 Python 称为「增长最快的主要编程语言」,Indeed.com 估计美国的 Python 开发人员平均年收入将超过 JavaScript 和 Java 的开发人员,达到 114,811 美元(参见《业界 2018 最流行的编程语言 Top 3(附薪资情况)》)。人生苦短,你还有什么理由不学 Python?

框架

深度学习是机器学习领域最热门的方向之一,而 Python 又是深度学习使用的热门语言,因此,能兼容 Python 的框架非常值得学习。下面我们将介绍两份框架学习教程。

TensorFlow

Kaggle 上的一份排行榜从领英职位需求、谷歌搜索热度、Medium 文章数、arXiv 论文数和 GitHub 活跃度等方面审视了不同的框架,发现 TensorFlow;) 是绝对赢家。在 GitHub 活跃度、谷歌搜索、Medium 文章数、亚马逊书籍和 arXiv 论文这些数据源上,它所占的比重都是最大的。此外,TensorFlow 还拥有最多的开发者用户,出现在最多的在线职位描述中。因此,框架还要从 TensorFlow 学起。

PyTorch

自 2017 年 1 月推出以来,PyTorch 热度持续上升,一度有赶超 TensorFlow 的趋势。PyTorch 能在短时间内被众多研究人员和工程师接受并推崇是因为其有着诸多优点,如采用 Python 语言、动态图机制、网络构建灵活以及拥有强大的社群等。因此,走上学习 PyTorch 的道路已刻不容缓。

Keras

数据

数据是人工智能发展的一大基石。这部分教程包含了 AI 研究者、工程师等相关人员需要的数据集和数据可视化方法。

数据集

数据可视化

进阶

掌握了基础知识,学了语言、框架,想不想在 AI 之路上再进一步呢?这一部分盘点了机器学习、深度学习、强化学习、计算机视觉、自然语言处理方面的理论知识、实践经验及工程技巧,此外还有全面、深入的详解、综述、竞赛类文章,既适合研究人员,也适合各个领域的工程师阅读学习。

机器学习

深度学习

强化学习

自然语言处理

综述/详解/竞赛

人生选择

继续深造还是就业?每个即将走出校门的人面临这种艰难的人生选择,甚至有些已经就业的人也在考虑重新选择。这里有一些过来人给出了一些实用的人生建议/职业指导,希望对你有所启发。

读博

就业

参考

  • 《新年大礼包:机器之心2018高分教程合集》