投资主题分析 - 聚类分析 - 《财务大数据DBE》

任务：
1 ，选择数据源
点击“选择数据源”，点击上方的“选择数据源框”，点击向下的箭头，选择“聚类分析原表（1）”，点击【保存】。
2 ，配置模型
点击配置模型，拖动模型库，选择聚类分析模型中的K-means，点击K-means参数设置框。
聚类变量：点击+号，将“净资产收益率”，“营业利润率”，“总资产报酬率”设置为变量，点击【确认】。
聚类个数：设置1—10；点击计算，查看计算结果；从图中可以研磨：K值超过3之后畸变程度变化显着着眼。因此，我们通常选择拐点（kneepoint）为最优的k，肘部就是K = 3；
最佳聚类个数：3
3 ，开始建模
4 ，查看聚类结果
将聚类结果下载到本地，将聚类结果表的第一列替换为公司名称，可以观察到算法将指标值都为正的聚变成一类。
5 ，第二次聚类，将指标为正的再次进行分组
将首次聚类表中指标值都为正的公司另存成一张表，然后将表数据上传，再次进行聚类分析，将指标表现出色的公司筛选出来。