一、背景
在2003 年的非典之后,消费者对健康都更加重视,给相应的保健品市场带来了新的机会。在一项保健产品研究中,客户开发了一种针对女性的新保健产品,经过初步测试,该产品具有多种保健功能。然而,鉴于这一市场的激烈竞争,客户很难在整个市场上同时出击,因此希望通过调研,对该类保健品市场结构进行细分,然后根据公司的IBMSPSS数据分析与挖掘实战案例精粹营销能力选择1、2个细分市场。研究中,客户计划采用3个步骤:市场细分/市场机会评估->目标人群确定->产品/品牌定位,以确定产品的市场定位,确保产品上市成功。为此,客户委托某研究公司进行了系列市场调研,研究分为3个阶段:第一阶段是定性研究,通过座谈会与深度访问方式,深入挖掘消费者使用保健产品的动机:第二阶段是定量研究,通过随机抽样方式来了解目标市场消费者的基本状况,并对市场进行细分;第三阶段是策略发展阶段,是在前两个研究的基础上,根据市场细分结果,通过公司内部分析以及外部竞争分析,确定公司产品的市场定位。
在该案例的第二阶段研究中,为了得到市场细分的初步方案,必须尝试多种细分方式,可以考虑的细分变量包括:消费者对养颜产品的使用方式、购买方式、消费者的生活方式、消费者的购买动机等。经过比较筛选,发现购买动机细分是比较有效的细分方式。为此研究者考虑在问卷中对购买动机数据进行采集。这些购买动机的词汇来源于第一阶段消费者对购买、使用保健产品的原因陈述,采用分量表测试消费者的态度,其中1分表示非常不同意,5分表示非常同意。
上述题目在访问时其出现顺序是随机的,除以上变量外,数据中还包含几个受访者特征变量:婚姻状况(已婚、独身)、教育水平、个人收入级别以及主要使用的保健产品。最终采集到的数据见文件“保健品.sav”。出于避免无谓纠纷的考虑,本案例的原始数据已经过编辑,不再代表实际市场情况。
二、分析目标
市场调研分为3个阶段:
第一阶段:定性研究,通过座谈会与深度访问方式,深入挖掘消费者使用保健产品的动机。
第二阶段:定量研究,通过随机抽样方式来了解目标市场消费者的基本状况,并对市场进行细分。
第三阶段:策略发展阶段,是在前两个研究的基础上,根据市场细分结果,通过公司内部分析以及外部竞争分析,确定公司产品的市场定位。
上述题目在访问时其出现顺序是随机的,除以上变量外,数据中还包含几个受访者特征变量:婚姻状况(已婚、独身)、教育水平、个人收入级别以及主要使用的保健产品(太太、乌鸡. 排毒、阿、红桃、脑白*、朵、 其他)。
具体而言,本研究在第二阶段期望达成的研究目的如下。
1)总目标为在上述可被直接测量的购买动机指标背后,究竟代表消费者怎样的内在购买需求?
基于上述总目标,可进一步细分出分目标如下。
2)不同保健品品牌的使用者在购买动机上有无明显差异?
3)基于上述内在购买需求,是否可将消费者分为若干群体?
三、数据准备
3.1 单变量描述
可以使用制表过程来得到非常精简的频数表格输出。
1)依次单击“分析”,“表”,“设定表”。
2)同时选中q5 01~q5 20,将其拖入表格画布上的行框。
3)“摘要统计量”框组,选中“隐藏”复选框。
4)“类别位置”,修改为“列中的行标签”。
5)确定。
频数表如下:
由表可见,所有20个变量取值均在1~5分之间,且五级得分均有较多的频数分布,这说明数据中确实存在充分的变异信息,有利于后续的信息提取。
3.2 变量关联探索
下面考虑对原始变量进行相关性分析,以初步考察其关联性,这可以用两两相关系数矩阵很容易地实现。
1)依次单击“分析”→“相关”→“双变量”。
2)将q5_01~q5_20选入“变量”列表框。
3)确定。
相关性如下:
为便于排版,这里只给出了前10个变量的相关矩阵,由结果可见,这些变量间存在着或强或弱的正相关性,说明上述变量之间的确存在信息重叠,这正是需要对数据进行因子分析的原因。
四、数据分析
4.1 利用因子分析进行信息浓缩
对本案例进行因子分析,由于事先并不确定该案例是否符合因子分析的要求,也不清楚究竟应当提取多少个公因子,因此首先进行适用条件的输出,按照默认设定输出初步的分析结果并加以观察。
利用SPSS数据分析软件操作步骤如下:
1)依次单击“分析”→“降维”→“因子分析”。
2)主对话框:将q5_01~q5_20选入“变量”列表框。
3)描述:选择“KMO”和“Bartlett的球形度检验”。
4)抽取:选择“碎石图”。
5)确定。
“因子分析”主对话框和“抽取”子对话框如下:
从结果可见,KMO统计量达到0.833,实际分析中,当KMO统计量在0.7以上时,因子分析的效果比较好,显然本案例满足此要求。Barlett 球形检验也具有统计学意义,说明变量间存在相关性,可以提取公因子。
提取出来的因子的方差解释比例如下:
由表可知前5个因子的特征根大于1,合计的方差解释度为53%,虽然比较低,但在实际调研项目中是常见的结果。一般而言,在市场研究的实际项目中,如果有严格的研究设计和前期定性研究为基础,因子分析的方差解释度大于50%就可以酌情接受了。
因子分析的碎石图输出如下:
碎石图前4个因子的信息量比较充分,第5、第6个因子的信息量比较接近。虽然细究起来直到第9个因子起才形成了平台,但是由于一共只有20个变量,考虑提取9个因子是过于奢侈的事情,因此只须考虑提取出4~6个因子即可。
4.2尝试对结果做初步解释
“因子分析:旋转”主对话框“选项”子对话框如下:
最后一张成分矩阵表格用于解释各原始变量和公因子之间的关系,但为了能够使结果阅读更为轻松,我们重新进行上面的分析,并且更改选项为:在“选项”对话框中,选择按大小排序、取消小系数。
上面的操作实际上只是对成分矩阵表格进行了输出格式的修改,现在可以看到按照系数绝对值大小进行排序后的成分矩阵,表五中的行变量顺序是按照绝对值从大到小的顺序排列(当存在多列时则按照从左到右的顺序优先排序),并且去掉了其中数值绝对值小于0.1的单元格输出。
成分矩阵如下:
实际上,表中绝对值在0.3以下的系数绝大多数情况下都可以忽略,0.3~0.5之间的只须参考。考察后可发现如下各点:
1)公因子1和大多数题目,特别是和使用效果方面的题目都存在正相关,因此可以命名为“综合效果”因子。
2)公因子2主要和同龄人都在服用、年轻人对我说该服用、希望自己像模特一样、女为悦己者容四项正相关,这些内容一方面反映的是年轻抗衰老,另外一方面反映了外界舆论的影响,因此属于复合因子,可以命名为“抗衰老+舆论引导”因子。
3)公因子3和提高睡眠质量正相关,但是却和去斑及去痘、去皱负相关,专业上难以解释,无法命名。
4)公因子4和使皮肤有光泽、令面色红润负相关,和通便润肠正相关,显然该因子的含义在专业上也是互相矛盾的,无法解释。
5)公因子5和“去痘”有一定的正相关,其次和“提供睡眠质量”有一定相关,可以命名为“去痘”因子。
这样,我们得到了一个综合效果因子,一个包括两种含义的复合因子,两个含义自相矛盾的因子,以及一个实际上只和一个自变量有关联的因子。因子分析的任务是寻找变量的内在联系,得到这样的结果,无疑是分析的失败。
4.3因子旋转
新增操作为在“旋转”子对话框中选择最大方差法,选中载荷图。
解释的总方差如下:
进行旋转后,提取出来的各因子的方差解释比例显然会发生变化,因此对应的表格会增加相应的输出,从表中可以看出公因子1的信息量明显减少,而提取出来的公因子2~5的信息量则有所增加,但是提取总量仍然为53%,保持不变。
旋转成分矩阵如下:
旋转后各因子在原始变量上的负荷可以总结出各因子的特征如下:
因子1: 主要和同龄人的行为、年轻人的建议、丈夫的审美观和模特的影响有关,因此可以将该因子命名为“外界舆论影响”。
因子2: 主要和延缓衰老、抗衰老、去皱以及调节内分泌有关,因此可以命名为“延缓衰老”。
因子3: 主要和提高睡眠质量、去除疲劳、消除黑眼圈、提高免疫力等有关,因此可以命名为“身体健康”。
因子4: 主要和皮肤有光泽、面色红润等有关,因此可以命名为“气色/肤色”。
因子5: 明显和去痘、去斑相关,除此之外,还和去皱、去黑眼圈、通便润肠等相关性较高,因此可以命名为“解决特定问题”。
在以上分析的基础上,还可以尝试提取出不同数量的因子,比如4个或6个,这里不再给出详细结果。相比之下,当提取4个因子时信息过于浓缩,而由上文可知因子s可以给予非常明确的专业含义解释,不宜压缩。当提取6个因子时,第六个因子只和“对自己好一些” 这个变量相关。显然,该因子的加入并不能帮助变量间关联性的解释,因此最终决定按照5个因子的结果进行后续分析。
4.4保存公因子
对于上述符合需求的因子分析模型,有必要将其分析结果保存起来供后续分析使用,操作如下:在“得分”子对话框中,选择“保存为变量”。
按此操作之后,数据集中会新增facl_1~fac5_1这5个新变量,分别代表上述5个公因子在每个案例中的具体数值。为便于后续分析,还可以将其分别进行相应的标签赋值操作,具体程序如下:
VARIABLELABELS FAC1_1 “1外界影响”/ FAC2_1 “2延缓衰老”
/FAC3_1 “3身体健康”/FAC4_1 “4气色肤色”/FAC5_1 “5特定问题”
4.5不同婚姻状况受访者的差异
数据中提供了受访者的婚姻状况,因此可以分析已婚和未婚人群在各因子的得分上有无差异。
(1)依次单击“分析”十“比较均值”>“独立样本t检验”。
(2)将facl .1~fac5 1选入“检验变量”列表框。
(3)将W1婚姻选入“分组变量”列表框。
(4)定义组按钮,将组别值指定为1和2,继续。
组统计量如下:
独立样本检验如下:
如上两个图为不同婚姻状况下各因子的均数和检验结果,可见未婚人群和已婚人群在外界影响因子、延缓衰老因子和特定问题因子上存在差异,而身体健康、气色/肤色两个因子则无差异。这并不是说这两个因子在人群中无区别,提取出来的公因子在人群中肯定存在差异,只是其区分方式和婚姻状况无关而已。
对于上述分析结果,研究人员往往在报告中会使用各种图形工具加以呈现,本例可以使用的图形有散点图、箱图等,这里我们绘制出前两个因子和婚姻状况的散点图。
散点图如下:
由图可见,不同婚姻状况的个体散点在二维平面上较清楚地分成了两大区域,未婚人群集中在右下角,而已婚人群集中在左上角。显然,对未婚人群而言,她们更加重视外界信息的影响,而对保健产品是否能够延缓衰老并不关心,这应当是由于未婚人群较为年轻所致,而与之相对应,已婚人群就更加重视保健品在延缓衰老上的功能,而由于已经逐渐形成了自己的审美观点,生活也已经趋于稳定,已婚人群对外界影响则呈现出了明显的忽视态度。
那么,特定问题因子上的差别又该如何解释呢?对未婚人群而言,其年龄较轻,粉刺、皮疹等较为多发,而此时年轻女性对自己的外表又十分敏感,自然会非常注意所用保健产品在这些方面的表现。而已婚人群上述问题已逐渐少发,且相对而言已不太敏感,因此不会太重视该因子。显然,以上三个因子的差异非常符合所研究人群的特征,均可得到很好的解释。
4.6 不同品牌保健品使用者的因子偏好差异
下面再对消费者主要服用的产品和因子评分间的关系进行探讨。由于产品种类较多,使用图形工具加以分析很占篇幅,且较为麻烦,为此我们直接输出各类别的因子均数进行比较。
1) 依次单击“分析”->“比较均值”->“均值”。
2)将facl 1~fac5 I选入“因变量”列表框。
3)将Q8选入“自子变量”列表框。
4)选项按钮,“单元格统计量”中只保留均值,继续。
5)确定。
在表中所有因子的总均值都为0,因为该均值代表的是整个样本的平均水平,因此表格中因子均值的正负完全代表相应群体和总样本相比的情况。从各因子的均数中我们可以发现许多有用的信息,例如:
服用 “太太” 的群体更注重气色/肤色因子、延缓衰老因子和外界影响因子,而.对身体健康因子则相对忽视。这应当与该群体多为低龄已婚人群有关。
“排毒”的使用者主要是为了解决特定间题而购买,这也符合该品牌的形象定位。
“红桃”的使用者更注重外界影响和身体健康因子,显然和该品牌的营销思路与主要功能特点有关。
“朵”的情况类似于“排毒”,购买者也是为了解决特定问题,但显然该群体更重视外界影响,这从另一个侧面反映出了“朵*”的媒体宣传力度要高于“排毒”。
除分析出各品牌的优劣势外,从中我们还可以发现一些品牌潜在的危机。
“ 乌鸡”的使用者非常重视外界影响,却忽视了其他因子,反映了该品牌的定位出现问题,其核心竞争力正在丧失,目前的市场主要依赖广告宣传在维持;相对而言“阿**”的市场做得非常差,其使用者在各项因子上的得分非负即零。说明该产品传统的保健价值并未得到市场接受,急需大力宣传。因子1外界影响的均值竟然只有-0.45,说明该产品在宣传方面欠账太多,酒香不怕巷子深的时代早已过去,有关厂家不能再自以为是地吃百年老店的老本了。
“脑白” 在各因子上均呈现出负数均值,反映出在经过连续几年过度的广告轰炸后,理性消费者已对该品牌非常麻木,剩余的消费人群很可能仅仅是依靠以前的购买行为支撑的惯性迟钝群体,而该品牌真正的核心用户已经彻底丧失,显然一旦减少广告投入,该品牌市场前景非常不妙。
上面我们主要采用描述和单变量分析的方法进行数据间差异的展现。显然,单变量分析的结果不如多变量分析更为客观准确,如果希望对以上分析结果作更为肯定、深入的发掘,则可以考虑使用多维偏好分析、判别分析等多变量、多元统计分析方法加以研究,这里不再展开讨论。
五、总结
5.1 研究结论
当前消费者购买同类保健品主要基于几点考虑:外界舆论影响、延缓衰老、保持身体健康、改善气色/肤色、解决特定问题。对上述因子的重视程度显然和年龄、婚姻状况等有关。低龄/未婚人群会更加重视外界舆论、解决特定问题等方面,而非低龄/已婚人群则会更加重视延缓衰老、保持健康、改善气色/肤色等方面。在目前市场上的同类品牌中,“太太”的市场状况和定位较好(事实上该品牌在当时正处在历史上最辉煌的时期),“排毒”、 “朵“的定位较为特殊,而“乌鸡”、“阿”等则存在很大问题。基于本品牌的产品特点,似乎可以考虑本产品上市后定位在非低龄/已婚人群的需求上,重点推广产品在延缓衰老、改善气色/肤色和解决特定问题这三个方面的价值,挤占“乌鸡”、“阿**” 等品牌原本应当占据的市场,在对手做出有效反应之前抢占相应细分市场的主要份额。
以上是第二阶段研究得到的基本结论,下面就需要根据这些结果,在第三阶段深入进行公司内部分析以及外部竞争分析,来确定上述产品的市场定位是否确实可行,以及具体的市场进入操作方式了。
5.2 合理解读因子分析的结果
以本案例为例,如果对原始的20个变量计算其均数和标准差,则结果如图所示。
描述统计量如下:
可以发现,精神状态好、提高免疫力这两项的均值都超过4,且标准差相对较小,也就是说受试者较为重视这两项功能,认为这应当是一个保健产品所必须具备的基本功能,不可能被忽视。但是,如果只看因子分析的结果,则这两项所代表的信息在结果中的表现并不特别突出。因此对于因子分析的结果,应当结合原始题目的均数来加以解释,均数代表的是平均水平,而因子分析则反映了个体间的差异,只有两者结合才能得到正确的分析结论。