密度聚类则是基于密度的聚类,它从样本分布的角度来考察样本之间的可连接性,并基于可连接性(密度可达)不断拓展疆域(类簇)。其中最著名的便是DBSCAN算法,首先定义以下概念:
    68747470733a2f2f692e6c6f6c692e6e65742f323031382f31302f31382f356263383466623962643639632e706e67.png68747470733a2f2f692e6c6f6c692e6e65742f323031382f31302f31382f356263383530396638643631392e706e67.png

    简单来理解DBSCAN便是:找出一个核心对象所有密度可达的样本集合形成簇。首先从数据集中任选一个核心对象A,找出所有A密度可达的样本集合,将这些样本形成一个密度相连的类簇,直到所有的核心对象都遍历完。DBSCAN算法的流程如下图所示:

    68747470733a2f2f692e6c6f6c692e6e65742f323031382f31302f31382f356263383530396665623538372e706e67.png