一、实验目的

聚类分析是根据事物本身的特性来定量研究分类问题的元统计分析方法。其基本思想是同一类中的个体有较大的相似性,不同类中的体差异较大,于是根据一批样品的多个观察指标,找出能够度量样品(或变量)之间的似度统计量,并以此为依据,采用某种聚类法,将所有的样品(或变量)分别聚合到不同的类中。

1.了解聚类分析的基本原理及实现过程。
2.通过对指标进行聚类,体会降维的处理过程。
3.通过不同性质指标对样本进行聚类,体会归类的思想。

二、实验步骤

1.收集数据:提供的鸢尾花数据和自动生成数据。
2.分析数据:对数据进行预处理。
3.训练算法:采用k-means聚类、DBSCAN聚类或谱聚类算法,对数据进行分类。
4.测试算法:编写一个函数来测试不同的聚类方法的效果。

三、实验要求

  1. 编写基于Python的算法代码,并检验分析结果。
    2. 尝试调整聚类算法的相关参数,观察算法效果是否会提升。

四、实验过程

K - means

Kmeans.ipynb

DBSCAN

DBscan.ipynb