Datawhale|Tianchi发布AI知识树 2021.02.13
近期Tianchi开放了9大训练营、26门课程、历届大赛和7大顶会论文解读。
包含Python、SQL、机器学习、强化学习、深度学习、计算机视觉、数据挖掘、自然语言处理、金融风控课程,历届大赛数据、资料,7大顶会论文解读。
路线|AI - 图1

基本功

AI概论

【重磅】阿里云大咖论AI 讲师: 阿里云大咖论AI

AI基础

Python语法 讲师:张宏伦
AI数学基础 讲师:雷明-SIGAI创始人

数据分析

Numpy实践 贡献团队:Datawhale
Pandas实践 贡献团队:Datawhale
Matplotlib实践 贡献团队:Datawhale

工具与框架⭐

天池比赛入门与实践 讲师:阿里云天池团队

AI理论⭐⭐⭐

机器学习

机器学习原理与实践 雷明-SIGAI创始人&&Datawhale

深度学习

深度学习原理与实践(持续更新中) 讲师:言有三(龙鹏)

强化学习

零基础入门强化学习-经典游戏挑战赛

应用领域

数据挖掘⭐

数据挖掘比赛

计算机视觉

达摩院视觉类AI技术解读 讲师: 星瞳

自然语言处理

开放语聊技术与应用 讲师: 达摩院算法专家-乐羽
机器阅读技术与应用 讲师: 达摩院算法专家-赵中州
达摩院NLP(自然语言处理)技术和应用 讲师: 达摩院高级算法专家-常龙

语音识别

语音识别原理与应用 讲师: 达摩院算法专家-张仕良
语音合成技术 讲师: 达摩院算法专家-杨辰雨
声纹识别技术 讲师: 达摩院算法专家-郑斯奇
人机对话技术浅析 讲师: 摩院高级算法工程师-陈谦

AI入门|从0到1

天池比赛入门与实践⭐

天池新手必备:轻松入门天池实验室、天池docker提交 讲师:阿里云天池团队

Python入门与实践

3大任务,带你开启编程人生 贡献团队:Datawhale

SQL入门与实践⭐

6大任务,掌握数据分析技能 贡献团队:Datawhale

机器学习入门与实践

3个基础算法结合有趣场景,实现机器学习初体验 贡献团队:Datawhale

深度学习入门与实践

3大任务,搞定CNN人脸识别 贡献团队:Datawhale

强化学习入门与实践

3大任务,成为强化学习通关达人 贡献团队:Datawhale

AI进阶

系统的课程,不同方向的实践

Python语法

用notebook、交互式学习方式, Python语法学习+实践一次搞定。 讲师:张宏伦

AI数学基础

用notebook、一次点出人工智能需要的线性代数、微积分、概率论等数学知识 讲师:雷明-SIGAI创始人

机器学习原理与实践

告诉你什么是机器学习,如何玩转机器学习 讲师:雷明-SIGAI创始人&&Datawhale

深度学习原理与实践

告诉你深度学习的历史和应用,带你实践深度学习算法 讲师:言有三(龙鹏)

数据挖掘入门与实践⭐

告学、练、赛模式带你轻松入门数据挖掘 贡献团队:Datawhale

计算机视觉入门与实践

学、练、赛模式带你轻松入门计算机视觉 贡献团队:Datawhale

自然语言处理入门与实践

学、练、赛模式带你轻松入门自然语言处理 贡献团队:Datawhale

金融风控入门与实践

学、练、赛模式带你轻松入门金融风控 贡献团队:Datawhale

AI实践

挑战天池大赛,提升算法能力

数据挖掘类比赛汇总⭐⭐

讲师:天池壮壮

自然语言处理类比赛汇总

讲师:天池壮壮

计算机视觉类比赛汇总

讲师:天池壮壮

程序设计类比赛汇总

讲师:天池壮壮

创新应用类比赛汇总

讲师:天池壮壮

AI学术

AAAI2021

AAAI 2021是人工智能领域的国际顶级学术会议,历史悠久,由美国美国人工智能协会主办(Association for the Advance of Artificial Intelligence),覆盖了机器学习、视觉、NLP等人工智能多个重点领域。
据悉,AAAI 2021于2月2日到2月9日在线上举办,大会一共收到9034篇论文,竞争激烈,其中有效审稿有7911篇,最终录取1692篇,

Who You Would Like to Share With? A Study of Share Recommendation in Social E-commerce
解读:北京邮电大学博士-纪厚业

Bridging the Domain Gap: Improve Informal Language Translation via Counterfactual Domain Adaptation
解读:北京大学博士-王科

AT-BERT:Adversarial Training BERT for Acronym Identification
解读:阿里集团-零售通技术部-朱丹青

Learning to Augment for Data-Scarce Domain BERT Knowledge Distillation
解读:阿里云-计算平台事业部-机器学习-岑鸣

Composite Adversarial Attacks
解读:阿里集团-CRO线-安全部-箫疯

Transformer-based Language Model Fine-tuning Methods for COVID-19 Fake News Detection
解读:新零售技术事业群-ICBU技术部-陈犇

CVPR 2020

本届CVPR 2020会议共收到投稿5865篇,最终收录1470篇,接受率22%,历年最低。
线上会议 CVPR2020 注册人数仍达到 7000人,其中华人占比 39.2%,阿里云支持了CVPR线上会议的中国所有访问。
本届会议阿里巴巴共18篇论文被大会收录,达摩院机器视觉实验室主办RetailVision Workshop 以及Ali Product Workshop Challenge , 比赛吸引688个队伍报名。
竞赛方面,达摩院视觉智能在 DAVIS Semi-supervised Challenge和HACS ActivitNet 两项比赛中获得第一, 淘宝技术团队在Deepfashion 比赛中获得第一。

学习地址:https://tianchi.aliyun.com/course/307

CVPR 2020 AliProducts Challenge:Large-scale Product Recognition
解读:达摩院-视觉技术-图像分析与理解-启磐

Artificial Intelligence Center CPR-GCN: Conditonal Partial-Residual Graph Convolutional Network
解读:达摩院-机器智能技术-昕翼

Domain adaptive hard example mining for fashion Instance retrieva
解读:淘系技术部-多媒体算法-视频内容理解-张爱喜(少麟)

Spatial Constrained Memory Network for Semi-supervised Video Object Segmentation
解读:达摩院-视觉技术-图像分析与理解-负天

Joint Learned and Traditional Video Compression
解读:达摩院-XG lab-王钊

Artificial Intelligence Center Spatial Likelihood Voting
解读:达摩院-机器智能技术-付志航

ACL 2020

ACL年会是计算语言学和自然语言处理领域最重要的顶级国际会议,CCF A类会议,由计算语言学协会主办,每年举办一次。
其接收的论文覆盖了对话交互系统、语义分析、摘要生成、信息抽取、问答系统、文本挖掘、机器翻译、语篇语用学、情感分析和意见挖掘、社会计算等自然语言处理领域众多研究方向。
本届ACL2020阿里18篇论文被大会收录,数量国内第一,阿里线上参与会议的展示介绍NLP研究。

Senior Algorithm Engineer SpanMlt: A Span-based Multi-Task Learning Framework for Pair-wise Aspect
解读:阿里安全-安全智能-黄龙涛(开阳)

Coupling Distant Annotation and Adversarial Training for Cross-Domain Chinese Word Segmentation
解读:达摩院-机器智能技术-丁宁

Dynamic Memory Induction Networks
解读:达摩院-机器智能技术-耿瑞莹(彧琛)

Multi-Domain Dialogue Acts and Response Co-Generation
解读:达摩院-机器智能技术-田俊峰

Multiscale Collaborative Deep Models
解读:达摩院-机器智能技术-魏相鹏

Knowledge Distillation For Multilingual Sequence Labeling
解读:达摩院-机器智能技术-王新宇

VLDB2020

VLDB是数据库领域三大顶级会议之一,其内容范围广,思路开阔。
除传统的优化器、引擎、分布式执行、事务并发控制等内容以外,还有大量的大数据处理、图数据、空间数据、文本及半结构化数据、流数据、数据挖掘和分析、众包、社交网络分析、可视化等方面的内容 。

2020年,VLDB收到750篇论文投稿,共95篇被接收,接受率不到18%(其中,PHD Workshop 13篇;Industrial Track 31篇;Demo Track 51篇)整体内容覆盖traditional database system、data analysis、data management、spatial and graph和machine leaning等领域,SQL的运用仍被多篇论文关注。
整体上看,数据库领域研究呈现出两个研究热点:
其一是基于新硬件特性的数据库原型系统(新硬件在多和计算、执行计划、储存架构等方面的研究);
其二是传统关系数据库技术在大数据处理平台的应用,在提高处理性能同时降低门槛。

数据库顶会VLDB 2020 中, 来自数据库产品事业部、计算平台事业部、新零售智能引擎智计算团队的13篇论文被大会收录,国内第一。

AnalyticDB-V:A Hybrid Analytical Engine Towards Query Fusion for Structured and Unstructured Data
解读:数据库产品事业部-OLAP产品部-魏闯先

Diagnosing Root Causes of Intermittent Slow Queries in Large-Scale Cloud Databases
解读:数据库产品事业部- 数据库自治服务DAS-殷征

Collecting and Analyzing Data Jointly from Multiple Services under Local Differential Privacy
解读:智能计算实验室-智能系统-丁博麟

Alibaba Hologres: A Cloud-Native Service for Hybrid Serving/Analytical Processing
解读:计算平台事业部-云原生数据仓库-蒋晓伟

Maximum Biclique Search at Billion Scale
解读:智能计算实验室-在线图计算-吕冰清

EMNLP2020

EMNLP是计算语言学和自然语言处理领域顶级国际会议之一,EMNLP 2020接收的论文覆盖了对话交互系统、信息抽取、信息检索和文档分析、词法语义、语言学理论、认知建模和心理语言学、用于NLP的机器学习、机器翻译与多语言、问答、句子级语义学、情感分析和论点挖掘、文本挖掘和NLP应用、文本推理等自然语言处理领域众多研究方向。
本届会议阿里巴巴被收录28篇论文,在数量上实现了突破 。

APE: Argument Pair Extraction from Peer Review and Rebuttal via Multi-task Learning
解读:达摩院-机器智能技术-自然语言智能-新加坡实验室-程丽颖

DAGA: Data Augmentation with a Generation Approach forLow-resource Tagging Tasks
解读:达摩院-机器智能技术-自然语言智能-新加坡实验室-丁博生/刘林林

ENT-DESC: Entity Description Generation by Exploring Knowledge Graph
解读:达摩院-机器智能技术-自然语言智能-新加坡实验室-程丽颖

An Unsupervised Sentence Embedding Method by Mutual Information Maximization
解读:达摩院-机器智能技术-自然语言智能-新加坡实验室-何瑞丹

ECCV2020

2020年国际三大计算机视觉顶尖会议之一的ECCV (欧洲计算机视觉国际会议)已经在8月23日线上拉开帷幕。
大会官方公布了2020年论文收录结果,2020投稿量再创新高,共5025篇有效投稿,相较上届翻了一倍多。
投稿激增的同时,接收率却大幅下降,今年ECCV共接收发表文章1361篇,接收率为27%,相比上届降低近5%,其中Oral论文接收率仅为2%,堪称史上最难ECCV。

Gradient Centralization: A New Optimization Technique for Deep Neural Networks
解读:鴻巍-阿里巴巴达摩院AIC深圳团队-实习生

Suppress and Balance: A Simple Gated Network for Salient Object Detection
解读:卢湖川-大连理工大学-教授

Label Propagation with Augmented Anchors: A Simple Semi-Supervised Learning baseline for Unsupervised Domain …
解读:张亚斌-阿里巴巴达摩院-实习生

A Single Stream Network for Robust and Real-time RGB-D Salient Object Detection
解读:赵骁琪-大连理工大学-研究生

The Why in Vision
解读:特约嘉宾-达摩院城市大脑-访问学者-张含望

Weakly Supervised Learning with Side Information
解读:达摩院-机器智能实验室-算法专家-佚南

Suppress and Balance: A Simple Gated Network for Salient Object Detection
解读:达摩院AIC深圳团队-研究型实习生-李晓明

A Decoupled Learning Scheme for Real-world A Decoupled Learning Scheme for Real-world Burst Denoising
解读:达摩院AIC深圳团队-研究型实习生-梁哲通

NeurIPS2020

NeurIPS作为学术界、工业界公认的人工智能领域国际顶级会议,代表着当今人工智能研究的最高水**平**。
今年,NeurIPS的论文投稿量增加了38%,共提交了12115篇论文摘要,9467篇论文,其中11%的论文被直接拒绝,最终接收论文1900篇,接收率约20.1%,创历史新低。
NeurIPS 2020阿里巴巴有23篇论文被大会收录,数量刷新了阿里的记录。

Latent Template Induction with Gumbel-CRFs
解读:符尧-爱丁堡大学自然语言处理研究组

Long-Tailed Classification by Keeping the Good and Removing the Bad Momentum Causal Effect
解读:汤凯华-达摩院-机器智能技术-城市大脑实验室

Incorporating BERT into Parallel Sequence Decoding with Adapters
解读:郭俊良-达摩院-机器智能技术-自然语言智能-翻译平台

Incorporating BERT into Parallel Sequence Decoding with Adapters
解读:张冬-南京理工大学-智能媒体分析实验室

Hard Example Generation by Texture Synthesis for Cross-domain Shape Similarity Learning
解读:木剑-新零售技术事业群-淘系技术部-商业机器智能部

Neuron-level Structured Pruning using Polarization Regularizer
解读:瑞溪-新零售智能引擎事业群-搜索推荐事业部-算法技术-搜索算法技术-基础排序和用户画像

Learning to Mutate with Hypergradient Guided Population
解读:Yaliang Li-新零售智能引擎事业群-智能计算实验室

AI训练营

实验室notebook算力支持,珍贵数据集。

「Python训练营」

基础语法实践+测试,开启编程人生

「SQL训练营」

基础语法实践+测试,开启编程人生

「机器学习训练营」

基础语法实践+测试,开启编程人生

「强化学习训练营」

基础语法实践+测试,开启编程人生

「深度学习训练营」

基础语法实践+测试,开启编程人生

「数据挖掘训练营」⭐

基础语法实践+测试,开启编程人生

「计算机视觉训练营」

基础语法实践+测试,开启编程人生

「自然语言处理训练营」

基础语法实践+测试,开启编程人生

「金融风控训练营」⭐

基础语法实践+测试,开启编程人生