资料来源:【github】datawhalechina/team-learning-data-mining

数据挖掘(异常检测)

贡献者信息

姓名 介绍 个人主页
梁家晖 广州城市理工学院,Datawhale成员 https://github.com/leungkafai
李玲 Datawhale成员 https://www.zhihu.com/people/liu-yu-18-38
李芝翔 华北电力大学,Datawhale成员 https://blog.csdn.net/weixin_39940512
赵可 国家电网,Datawhale成员
陈信达【运营,群主】 华北电力大学,Datawhale成员
林星良【领航员】 Datawhale成员,华南理工大学 https://github.com/Aliang-CN

基本信息

  • 贡献人员:梁家晖,李玲,李芝翔,赵可,陈信达,林星良
  • 学习周期:15天,每天平均花费时间2小时-5小时不等,根据个人学习接受能力强弱有所浮动。
  • 学习形式:理论
  • 人群定位:熟悉数据挖掘的基本方法,对学习异常检测算法有需求的学员。
  • 先修内容:具备数理统计与概率论基础即可。

    学习目标

    理解传统的异常检测方法原理,并具备基本的调用相应python库进行操作的能力。

    任务安排

    Task00:熟悉规则(1天)

  • 组队、修改群昵称

  • 熟悉打卡规则。

    Task01:异常检测介绍(2天)

  • 了解异常检测基本概念

  • 了解异常检测基本方法

    Task02:基于统计学的方法(3天)

  • 掌握基于高斯分布的异常检测方法

  • 理解非参数异常检测方法
  • 掌握HBOS算法

    Task03:线性模型(3天)

  • 理解线性回归

  • 掌握主成分分析的异常检测方法

    Task04:基于相似度的方法(3天)

  • 理解基于距离的异常检测方法

  • 掌握基于密度的LOF算法

    Task05:集成方法(3天)

  • 了解集成方法的思想

  • 理解feature bagging原理
  • 掌握孤立森林算法

关于Datawhale
Datawhale是一个专注于数据科学与AI领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。Datawhale以“for the learner,和学习者一起成长”为愿景,鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。同时Datawhale 用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人,人与知识,人与企业和人与未来的联结。