9.4.1 聚类的核心指标与非聚类的业务指标相辅相成
    聚类分析技术在实践应用中有个比较明显的不足之处,那就是参与聚类的变量数目不能多,需要坚持少而精的原则,否则不仅运算耗时,而且聚类的效果也不好。但是,另一方面,从业务需求的实际出发,业务应用应让尽可能多的指标进入分析范围,这样得到的信息更丰富、更全面,也才更有可能发现业务线索。那如何协调两者的矛盾呢?
    在实践中,已经有了比较成熟且行之有效的方法可以较好地解决上述矛盾。一方面坚持参与聚类的变量少而精的原则,另一方面把非聚类的业务指标与聚类结果一起拿来分析、提炼、挖掘,这种相辅相成的做法在聚类分析的应用实践中已经得到了普遍的认可和采用。
    具体来说,先通过用户行为属性里的核心字段进行聚类分群,在得到比较满意的聚类分群结果之后,针对每个具体细分的对象群体,再分别考察用户的会员属性,包括年龄、性别、地域、收入、爱好等一系列的基础信息。如果这些属性在聚类细分后的群体里有显著的区别或特征,将会明显丰富仅仅依靠参与聚类的少数字段所能揭示的业务特征和线索。