资料来源:【github】datawhalechina/team-learning-data-mining
数据挖掘(异常检测)
贡献者信息
姓名 | 介绍 | 个人主页 |
---|---|---|
梁家晖 | 广州城市理工学院,Datawhale成员 | https://github.com/leungkafai |
李玲 | Datawhale成员 | https://www.zhihu.com/people/liu-yu-18-38 |
李芝翔 | 华北电力大学,Datawhale成员 | https://blog.csdn.net/weixin_39940512 |
赵可 | 国家电网,Datawhale成员 | |
陈信达【运营,群主】 | 华北电力大学,Datawhale成员 | |
林星良【领航员】 | Datawhale成员,华南理工大学 | https://github.com/Aliang-CN |
基本信息
- 贡献人员:梁家晖,李玲,李芝翔,赵可,陈信达,林星良
- 学习周期:15天,每天平均花费时间2小时-5小时不等,根据个人学习接受能力强弱有所浮动。
- 学习形式:理论
- 人群定位:熟悉数据挖掘的基本方法,对学习异常检测算法有需求的学员。
-
学习目标
理解传统的异常检测方法原理,并具备基本的调用相应python库进行操作的能力。
任务安排
Task00:熟悉规则(1天)
组队、修改群昵称
-
Task01:异常检测介绍(2天)
了解异常检测基本概念
-
Task02:基于统计学的方法(3天)
掌握基于高斯分布的异常检测方法
- 理解非参数异常检测方法
-
Task03:线性模型(3天)
理解线性回归
-
Task04:基于相似度的方法(3天)
理解基于距离的异常检测方法
-
Task05:集成方法(3天)
了解集成方法的思想
- 理解feature bagging原理
- 掌握孤立森林算法
关于Datawhale:
Datawhale是一个专注于数据科学与AI领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。Datawhale以“for the learner,和学习者一起成长”为愿景,鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。同时Datawhale 用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人,人与知识,人与企业和人与未来的联结。