image.pngimage.png

    任务:
    1 ,选择数据源
    点击“选择数据源”,点击上方的“选择数据源框”,点击向下的箭头,选择“聚类分析原表(1)”,点击【保存】。
    2 ,配置模型
    点击配置模型,拖动模型库,选择聚类分析模型中的K-means,点击K-means参数设置框。
    聚类变量:点击+号,将“净资产收益率”,“营业利润率”,“总资产报酬率”设置为变量,点击【确认】。
    聚类个数:设置1—10;点击计算,查看计算结果;从图中可以研磨:K值超过3之后畸变程度变化显着着眼。因此,我们通常选择拐点(kneepoint)为最优的k,肘部就是K = 3;
    最佳聚类个数:3
    3 ,开始建模
    4 ,查看聚类结果
    将聚类结果下载到本地,将聚类结果表的第一列替换为公司名称,可以观察到算法将指标值都为正的聚变成一类。
    5 ,第二次聚类,将指标为正的再次进行分组
    将首次聚类表中指标值都为正的公司另存成一张表,然后将表数据上传,再次进行聚类分析,将指标表现出色的公司筛选出来。