资源分类

  1. [- Pytorch资源 主要是md书籍和代码](#X6f8489c8447f7c45e26f4e0828e831a631201a5)<br /> [- 这里是nlp的一些小例子](#X96e1cd83be77565f011d6cfe72aa84ac6fa1485)<br /> [一些觉得能用的上的ai库](#一些觉得能用的上的ai库)<br /> [一些数据集集合或者是项目的例子](#一些数据集集合或者是项目的例子)<br />

- Pytorch资源 主要是md书籍和代码

资源链接 简介
https://github.com/yunjey/pytorch-tutorial pytorch 指南
https://github.com/udacity/deep-learning-v2-pytorch 深度学习pytorch第二版
https://github.com/deeplearningzerotoall/PyTorch 深度学习从零开始 pytorch
https://github.com/rguthrie3/DeepLearningForNLPInPytorch 深度学习nlp pytorch
https://github.com/L1aoXingyu/code-of-learn-deep-learning-with-pytorch 用pytorch学习深度学习的代码
https://github.com/PacktPublishing/Deep-Learning-with-PyTorch 深度学习pytorch
https://github.com/zergtant/pytorch-handbook pytorch便携书
https://github.com/ShusenTang/Dive-into-DL-PyTorch 李沐的动手学深度学习
https://github.com/falloutdurham/pytorchupandrunning pytorch 代码

- 这里是nlp的一些小例子

资源链接 简介
https://github.com/ForestsKing/NLP-Study nlp学习
https://github.com/susanli2016/NLP-with-Python python nlp
https://github.com/fastai/fastbook fastai的教程
https://github.com/jbarrow/allennlp_tutorial 艾伦nlp指南
https://github.com/allenai/allennlp-as-a-library-example 艾伦nlp的实例
https://github.com/hb20007/hands-on-nltk-tutorial 动手NLTK教程
https://www.socher.org/index.php/DeepLearningTutorial/DeepLearningTutorial 深度学习指南
https://github.com/Socialbird-AILab/BERT-Classification-Tutorial 用于bert文本分类教程
https://github.com/terrifyzhao/bert-utils 生成句向量和文本分类
https://github.com/huggingface/pytorch-pretrained-BERT huggingface的预训练模型
https://github.com/asyml/texar 用于文本生成和自然语言处理的一个工具
https://github.com/graykode/nlp-tutorial nlp教程
https://github.com/rsanshierli/EasyBert bertpytorch的教程
https://github.com/DSKSD/DeepNLP-models-Pytorch 224n pytorch实现
https://huggingface.co/course/chapter1 huggingface官方教程
https://github.com/microsoft/nlp-recipes 微软的nlp
https://pub.towardsai.net/natural-language-processing-nlp-with-python-tutorial-for-beginners-1f54e610a1a0 初学者的nlp教程

一些觉得能用的上的ai库

资源链接 简介
https://github.com/fastai/fastai fastai很出名
https://github.com/pytorch/fairseq 脸书旗下的
https://github.com/alibaba/EasyTransfer 阿里的文本迁移学习工具
https://github.com/jiesutd/NCRFpp 序列标注任务的库
https://github.com/zhanlaoban/EDA_NLP_for_Chinese 中文文本增强的库
https://github.com/fighting41love/funNLP 这个就是一些资源集合
https://github.com/CornellNLP/Cornell-Conversational-Analysis-Toolkit 康奈尔的对话分析工具
https://github.com/howl-anderson/Chinese_models_for_SpaCy 中文的SPACY
https://github.com/deepcs233/jieba_fast 用c写的结巴
https://github.com/425776024/nlpcda 做文本增强的
https://github.com/huyingxi/Synonyms 中文近义词
https://stanfordnlp.github.io/stanfordnlp/ 斯坦福的nlp工具
https://github.com/Tencent/NeuralNLP-NeuralClassifier 这个是腾讯文本分类
https://github.com/bojone/kg-2019 2019年百度的三元组抽取
https://github.com/tomgrek/zincbase 知识图谱构建工具包
http://graphbrain.net/installation.html#install-with-pip-recommended 一个文本知识相关的库
https://github.com/letiantian/TextRank4ZH 这个是计算textrank的中文实现,用来抽取文档关键词
https://github.com/howl-anderson/hanzi_char_featurizer 这个就是提取中文的字符级特征的
https://github.com/quincyliang/nlp-data-augmentation 数据增强资源
https://github.com/ownthink/Jiagu 甲骨也是一个中文文本处理的一个工具好像是不够快文本量大的情况下不要用
https://github.com/stanfordnlp/stanza 这个其实也是斯坦福nlp工具
https://github.com/dongrixinyu/JioNLP 这个也是中文nlp处理的工具包
https://github.com/zedom1/error-detection 中文文本纠错
https://github.com/breezedeus/cnocr 中文OCR
https://github.com/camelot-dev/camelot PDF表格提取工具
https://github.com/jbesomi/texthero 文本预处理包
https://github.com/OpenNMT/Tokenizer 这个就是基于Unicode编码文本的快速token工具
https://github.com/RandyPen/TextCluster 短文本聚类 适合分析处理文本数据集
https://github.com/PaddlePaddle/Parakeet 百度的文本语音合成工具
https://github.com/Kaleidophon/token2index 这个是一个英文在语料上快速构建字典
https://github.com/lukhy/masr 中文语音识别
https://github.com/awslabs/dgl-ke 做知识图谱嵌入的工具
https://github.com/PAIR-code/facets 数据集可视化包
https://github.com/graph4ai/graph4nlp 自然语言处理的图机器学习工具包
https://github.com/aimhubio/aim 模型可视化工具

一些数据集集合或者是项目的例子

资源链接 简介
https://github.com/liuhuanyong/ComplexEventExtraction 中文事件抽取
https://github.com/liuhuanyong/CrimeKgAssitant 使用法律知识图谱做的罪名法务系统
https://github.com/liuhuanyong/TextGrapher 文档图谱生成
https://github.com/geekinglcq/CDCS 这个是中文的nlp项目
https://github.com/explosion/projects 这个也是nlp的项目实例和代码集
https://github.com/lemonhu/stock-knowledge-graph 证券知识库
https://github.com/InsaneLife/ChineseNLPCorpus 中文语料数据集
https://github.com/zhpmatrix/nlp-competitions-list-review nlp竞赛技巧
https://github.com/WenRichard/KBQA-BERT 基于知识图谱的问答系统
http://openkg.cn/dataset/39801d1b-0b51-4cde-a06c-62def5a70563 中英文新冠知识图谱
https://github.com/UCSD-AI4H/COVID-Dialogue 新冠中文医疗对话数据集
https://github.com/UCSD-AI4H/Medical-Dialogue-System 110万医患问答
https://github.com/abachaa/MedQuAD 英文医学问答
https://github.com/GanjinZero/awesome_Chinese_medical_NLP 中文医学nlp资源