战略模型
波特五种竞争力分析模型
波特的五种竞争力分析模型被广泛应用于很多行业的战略制定。波特认为在任何行 业中,无论是国内还是国际,无论是提供产品还是提供服务,竞争的规则都包括在 五种竞争力量内。这五种竞争力就是企业间的竞争、潜在新竞争者的进入、潜在替 代品的开发、供应商的议价能力、购买者的议价能力。这五种竞争力量决定了企业 的盈利能力和水平。
企业间的竞争
潜在新竞争者的进入
潜在替代品的开发
供应商的议价能力
购买者的议价能力
竞争对手
企业间的竞争是五种力量中最主要的一种。只有那些比竞争对手的战略更具优势的战略才可能获得成功。为此,公司必须在市场、价格、质量、产量、功能、服务、研发等方面建立自己的核心竞争优势。
影响行业内企业竞争的因素有:产业增加、固定(存储)成本/附加价值周期性生产过剩、产品差异、商标专有、转换成本、集中与平衡、信息复杂性、竞争者的多样性、公司的风险、退出壁垒等。
新进入者
企业必须对新的市场进入者保持足够的警惕,他们的存在将使企业做出相应的反应,而这样又不可避免地需要公司投入相应的资源。
影响潜在新竞争者进入的因素有:经济规模、专卖产品的差别、商标专有、资本需求、分销渠道、绝对成本优势、政府政策、行业内企业的预期反击等。
购买者
当用户分布集中、规模较大或大批量购货时,他们的议价能力将成为影响产业竞争强度的一个主要因素。
决定购买者力量的因素又:买方的集中程度相对于企业的集中程度、买方的数量、买方转换成本相对企业转换成本、买方信息、后向整合能力、替代品、克服危机的能力、价格/购买总量、产品差异、品牌专有、质量/性能影响、买方利润、决策者的激励。
替代产品
在很多产业,企业会与其他产业生产替代品的公司开展直接或间接的斗争。替代品的存在为产品的价格设置了上限,当产品价格超过这一上限时,用户将转向其他替代产品。
决定替代威胁的因素有:替代品的相对价格表现、转换成本、客户对替代品的使用倾向。
供应商
供应商的议价力量会影响产业的竞争程度,尤其是当供应商垄断程度比较高、原材料替代品比较少,或者改用其他原材料的转换成本比较高时更是如此。
决定供应商力量的因素有:投入的差异、产业中供方和企业的转换成本、替代品投入的现状、供方的集中程度、批量大小对供方的重要性、与产业总购买量的相关成本、投入对成本和特色的影响、产业中企业前向整合相对于后向整合的威胁等。
SWOT分析模型
“SWOT”是Strength、Weakness、Opportunity、Threat四个英文单词的缩写,这个模 型主要是通过分析企业内部和外部存在的优势和劣势、机会和挑战来概括企业内外部研 究结果的一种方法。
S-优势: 比较分析企业在外部市场环境、内部经营方面相对于其他竞争对手的优势
W-劣势:比较分析企业在外部市场环境、内部经营方面相对于其他竞争对手的劣势
O-机会: 分析在目前的市场竞争态势下企业存在的发展机会
T-挑战: 分析在目前的市场竞争态势下企业存在的威胁和挑战
• 创业团队丰富的互联网及物业行业经验 | • 对线下服务的控制力弱 |
||
---|---|---|---|
S | • 商业模式的突破口阻力小、较有利于锁定物业及其他领域的合作伙伴 | W | • C端的使用习惯及影响力有待培育,其切入点有待探索 |
0 |
• 社区是大流量级空间,堪比商业地产空间 • 房地产行业周期性回落,面临结构性变革,需探索新的盈利点,尤其是墙关联的社区服务领域 |
T |
• 开发商、大中型物业公司、物业软件开发商及电商平台对社区及C端控制权的争夺 • 社区商业业态亟需构建 |
战略地位与行动评价矩阵
战略地位与行动评价矩阵(Strategic Position and Action Evaluation Matrix,简称SPACE矩阵) 主要是分析企业外部环境及企业应该采用的战略组合。
SPACE矩阵有四个象限分别表示企业采取的进取、保守、防御和竞争四种战略模式。这个矩阵的 两个数轴分别代表了企业的两个内部因素——财务优势(FS)和竞争优势(CA);两个外部因两个外部因素——环境稳定性(ES)和产业优势(IS)。这四个因素对于企业的总体战略地位是最为重要的
建立SPACE矩阵的步骤如下:
1)选择构成财务优势(FS)、竞争优势(CA)、环境稳定性(ES)和产业优势(IS)的一组变量;
2)对构成 FS 和 IS 的各变量给予从 +1(最差)到 +6(最好)的评分值。而对构成 ES 和 CA 的轴的各变量从 -1(最好)到 -6(最差)的评分值;
2)将各数轴所有变量的评分值相加,再分别除以各数轴变量总数,从而得出 FS、CA、IS 和 ES 各自的平均分数;
4)将 FS、CA、IS 和 ES 各自的平均分数标再各自的数轴上;
5)将 X 轴的两个分数相加,将结果标在 X 轴是;将 Y 轴的两个分数相加,将结果标在 Y 轴上;标出 X、Y 数轴的交叉点;
6)自 SPACE 矩阵原点到 X、Y 数值的交叉点画一条向量,这一条向量就表示企业可以采取的战略类型。
SPACE 矩阵要按照被研究企业的情况而制定,并要依据尽可能多的事实信息。根据企业类型的不同,SPACE 矩阵的轴线可以代表多种不同的变量。如,投资收益、财务杠杆比率、偿债能力、流动现金、流动资金等。
SCP分析模型
SCP(structure、conduct、performance)模型,分析在行业或者企业收到表面冲击时,可能的 战略调整及行为变化。
SCP模型从对特定行业结构、企业行为和经营结果三个角度来分析外部冲击的影响。
外部冲击:主要是指企业外部经济环境、政治、技术、文化变迁、消费习惯等因素的变化;
行业机构:主要是指外部各种环境的变化对企业所在行业可能的影响,包括行业竞争的变化、产品需求的变化、细分市场的变化、营销模型的变化等。
企业行为:主要是指企业针对外部的冲击和行业结构的变化,有可能采取的应对措施,包括企业方面对相关业务单元的整合、业务的扩张与收缩、营运方式的转变、管理的变革等一系列变动。
经营结果:主要是指在外部环境方面发生变化的情况下,企业在经营利润、产品成本、市场份额等方面的变化趋势。
外部冲击:主要是指企业外部经济环境、政治、技术、文化变迁、消费习惯等因素的变化;
行业结构:主要是指外部各种环境的变化对企业所在行业可能的影响,包括行业竞争的变化、产品需求的变化、细分市场的变化、营销模型的变化等。
企业行为:主要是指企业针对外部的冲击和行业结构的变化,有可能采取的应对措施,包括企业方面对相关业务单元的整合、业务的扩张与收缩、营运方式的转变、管理的变革等一系列变动。
经营绩效:主要是指在外部环境方面发生变化的情况下,企业在经营利润、产品成本、市场份额等方面的变化趋势。
战略钟
“战略钟”是分析企业竞争战略选择的一种工具,这种模型为企业的管理人员和咨询顾问提供了 思考竞争战略和取得竞争优势的方法。
战略钟模型假设不同企业的产品或服务的适用性基本类似,那么,顾客购买时选择其中一家而不 是其他企业可能有以下原因:
1) 这家企业的产品和服务的价格比其他公司低;
2) 顾客认为这家企业的产品和服务具有更高的附加值。
低价低值战略:采用途径 1 的企业关注的是对价格非常敏感的细分市场的情况。
企业采用这种战略是在降低产品或服务的附加值的同时降低产品或服务的价格。
低价战略:采用途径 2 的企业是建立企业竞争优势的典型途径,即在降低产品或服务的价格的同时,包装产品或服务的质量。
但是这种竞争策略容易被竞争对手模仿,也降低价格。在这种情况下,如果一个企业不能将价格降低到竞争对手的价格以下,或者顾客由于低价格难以对产品或服务的质量水平做出准确的判断,那么采用低价策略可能是得不偿失的。要想通过这一途径获得成功,企业必须取得成本领先地位。因此,这个途径实质上是成本领先战略。
差别化战略:采用途径 3 的企业以相同和略高于竞争对手的价格向顾客提供可感受的附加值,其目的是通过提供更好的产品和服务来获得更多的市场份额,或者通过稍高的价格提高收入。
企业可以通过采取有形差异化战略,如产品在外观、质量、功能等方面的独特性;也可以采取无形差异化战略,如服务质量、客户服务、品牌文化等来获得竞争优势。
混合战略:采用途径 4 的企业在为顾客提供可感知的附加值同时保持低价格。
而这种高品质低价格的策略能否成功,既取决于企业理解和满足客户需求的能力,又取决于是否有保持低价格策略的成本基础,并且难以被模仿。
集中差别化战略:采用途径 5 的企业可以采用高品质高价格策略在行业中竞争,即以特别高的价格为用户提供更高的产品和服务的附加值。
但是采用这样的竞争策略意味着企业只能在特定的细分市场中参与经营和竞争。
高价撇脂战略:采用途径 6、7、8 的企业一般都是处在垄断经营地位,完全不考虑产品的成本和产品或服务队附加值。
企业采用这种经营战略的前提是市场中没有竞争对手提供类似的产品和服务。否则,竞争对手很容易夺得市场份额,并很快削弱采用这一策略的企业的地位。
波士顿分析矩阵
波士顿矩阵是由波士顿公司提出的,这个模型主要用来协助企业进行业务组合或投资组合。
在矩阵坐标轴是的两个变量分别是业务单元所在市场的增长程度和所占据的市场份额。每个象限 中的企业处于根本不同的现金流位置,并且应用不同的方式加以管理,这样就引申出公司如何寻 求其总体业务组合。
金牛:在低增长市场上具有相对高的市场份额的业务将产生健康的现金流,它们能用于向其他 方面提供资金,发展业务。
瘦狗:在低增长市场是具有相对低的市场份额的业务经常是中等现金流的使用者。由于其虚弱 的竞争地位,它们将成为现金的陷阱。
明星:在高增长市场上具有相对高的市场份额通常需要大量的现金以维持增长,但具有较强的 市场地位并将产生较高的报告利润,它们有可能处在现金平衡状态。
问题:在迅速增长的市场上具有相对较低市场份额的业务需要大量的现金流入,以便为增长筹 措资金。
GE行业吸引力矩阵
这个模型是通用公司和麦肯锡公司所使用的三三矩阵。这个矩阵的两个轴分别表示市场吸引力和 业务单位的实力或竞争地位。一个特定的业务单位处于矩阵中何处是通过对这个特定的业务单位 和行业分析加以确定的。通过对这两个变量进行打分,确定业务单位位于矩阵中的位置,并由此 来确定对该业务单位所采取的策略
对于市场吸引力,需要考虑的因素主要有:
行业:绝对市场规模、成长率、价格敏感性、进入壁垒、替代品、市场竞争、供应商等;
环境:政府法规、经济气候、通货风险、社会趋势、技术、就业、利率等。
对于业务单位的实力或竞争地位,需要考虑的因素主要有:
目前优势:市场份额、市场份额变化趋势、盈利能力、现金流、差别化、相对价格地位等。
持久性:成本、后勤、营销、服务、客户形象、技术等。
三四矩阵
三四矩阵是由波士顿咨询集团提出的。这个模型用于分析一个成熟市场中企业的竞争地位
在一个稳定的竞争市场中,参与市场竞争的参与者一般分为三类,领先者、参与者、生存者。优胜者一般是指市场占有率在 15% 以上,可以对市场变化产生重大影响的企业,如在价格、产量等方面;参与者一般是指市场占有率介于 5%~15% 之间的企业,这些企业虽然不能对市场产生重大的影响,但是它们是市场竞争的有效参与者;生存者一般是局部细分市场填补者,这些企业的市场份额都非常低,通常小于 5%。
在有影响力的领先者之中,企业的数量绝对不会超过三个,而在这三个企业之中,最有实力的竞争者的市场份额又不会超过最小者的四倍。这个模型是由下面两个条件决定的:
- 在任何两个竞争者之间,2 比 1 的市场份额似乎是一个均衡点。在这个均衡点上,无论哪个竞争者要增加或减少市场份额,都显得不切实际而且得不偿失。这是一个通过观察的出动 经验性结论。
- 市场份额小于最大竞争者的 1/2,就不可能有效参与竞争。这也是经验性结论,但是不难从经验曲线的关系中推断出来。
价值链模型
价值链模型最早是由波特提出的。波特认为企业的竞争优势来源于企业在设计、生产、营销、交 货等过程及辅助过程中所进行的许多相互分离的活动,这些活动中的每一种都对企业的相对成本地位有所贡献,并奠定了企业竞争优势的基础。价值链模型将一个企业的行为分解为战略性相关的许多活动。企业正是通过比其竞争对手更廉价或更出色地开展这些重要的战略活动来赢得竞争优势的。
价值活动分为两大类:基本活动和辅助活动。
- 基本活动是涉及产品的物质创造及其销售、转移买方和售后服务的各种活动。
- 辅助活动是辅助基本活动,并通过提供采购投入、技术、人力资源以及各种公司范围的职能支持基本活动。
设计任何产业内竞争的各种基本活动有五种类型:
内部后勤:与接收、存储和分配相关联的各种活动,如原材料搬运、仓储、库存控制、车辆调 度和向供应商退货。
生产作业:与将投入转化为最终产品形式相关的各种活动,如机械加工、包装、组装、设备维 护、检测等。
外部后勤:与集中、存储和将产品发送给买方有关的各种活动,如产成品库存管理、原材料搬 运、送货车辆调度等。
市场和营销:与提供买方购买产品的方式和引导它们进行购买相关的各种活动,如广告、促销、 销售队伍、渠道建设等。
服务:与提供服务以增加或保持产品价值有关的各种活动,如安装、维修、培训、零部件供 应等。
采购:指购买用于企业价值链各种投入的活动,采购既包括企业生产原料的采购,也包括辅助活动相关的购买行为,如研发设备的购买等。
技术开发:每项价值活动都包含着技术充分,无论是技术诀窍、程序,还是在工艺设备中所体现出来的技术。
人力资源管理:包括各种涉及所有类型人员的招聘、雇佣、培训、开发和报酬等各种活动。人力资源管理不仅对基本和辅助活动起到辅助作用,而且支撑着整个价值链。
基础设施:企业基础设施支撑了企业的价值链条。
价值链的框架是将链条从基础材料到最终用户分解为独立工序,以理解成本行为和差异来源。通过分析每道工序系统的成本、收入和价值,业务部门可以获得成本差异、累计优势。下图为复印机生产企业的价值链。
ROS/RMS矩阵
ROS/RMS(Return Of Sales/Relative Market Share)矩阵也称做销售回报和相对市场份额矩阵, 主要是用来分析企业的不同业务单元或产品的发展战略。这个模型认为,企业某个业务单元或产 品在市场上的销售额应该与其在市场中的相对份额成正比,并且该业务单元或产品的销售额越高,该业务单元或产品为企业所提供的销售回报就应该越高。
如下图,企业的某种业务单元或产品的销售额在由低向高不断增加,其相对市场份额和销售回报 也在一个“通道”内由低向高不断增加。如果该业务单元或产品的销售额增加,而其对企业的销 售回报或相对市场份额降低,那么企业就不应该在这个时候进入其他领域,应该着重改善这个业 务单元或产品的经营状况。
PESTEL
3C战略模型
适用场景:企业经营战略
理论来源:大前研一
3C战略模型,由管理学家大前研一提出,他认为在制定任何营销战略时,都必须考虑这三个因素:顾客需求,竞争对手情况,公司自身能力或资源。
战略,本质上就是一个公司的能力可以有效满足客户需求,并且让其自身有效地区分于竞争对手。
增长模型
AARRR模型
在战略咨询中有一个方法论叫 mutually exclusive and collectively exhaustive (MECE),基于这个原则,我们设计一个完整描述产品和用户关系的逻辑框架,包括5各阶段:用户获取、初次 体验、回头客、转化收益、口碑传播这五个步骤。
此处可利用互联网经典获客模型ARRR模型进行分析:
AARRR模型
AARRR从整个用户生命周期入手,包括Acquisition用户获取,Activation用户转化,Retention用 户留存与活跃,Revenue用户产生收入,到发起传播Refer
将AARRR应用到渠道新用户的获取上面,则对应的是:
用户获取核心指标
针对每一个流程,在实际操作时需要时刻具备数据思维,留意每一步的指标变化情况,将每一步 的转化率提升,从而降低用户获客成本,以及获取更好的用户质量
RFM分析
根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个要素:R(Recency)、F(Frequency)、M(Monetary)。
消费金额是所有数据库报告的支柱,也可以验证“帕雷托法则”(Pareto’s Law)——公司80%的收入来自20%的顾客。
利用这个模型召回老客户之前,需要先捋清楚每一个象限的意义:
1. 越接近右上角象限的客户越优质,复购越强,对品牌忠诚度越高;
2. 位于21-25象限的客户,只要再购买一次,就直接变成象限16的客户;位于6-10象限的客户, 只要再购买一次,就直接变成象限1的客户。
3. 象限25属于流失客户,象限1属于绝对忠实老客户(这种客户沟通打电话最直接),重点关 注象限5和10的客户(为什么你的忠实老客户流失了?)……
用户行为决策分析模型
AISAS 模型是目前最通用的“用户决策行为分析模型”,两个具备网络特质的“S”,指出了互联网时代下搜索(Search)和分享(Share)的重要性,而不是一味地向用户进行单向的理念灌 输,充分体现了互联网对于人们生活方式和消费行为的影响与改变。
AHA moment
什么是「Aha moment」
「Aha moment」也叫「啊哈时刻」、「顿悟时刻」、「尤里卡效应」,就是用户第一次 get 到你产品价值的时刻。它通常出现在用户第一次使用你的产品时,特别是用户激活的过程中。顾名思义,「啊哈」是一种情绪表达,它让用户留下了足够强烈的第一印象,从而不断回到你的产品中来。
换句话说,一旦用户进入你的产品,就会开始寻找产品对他们的价值。用户确认产品「有用」的那一刻,就遇到了你产品中的 Aha moment。用户可能会,也可能不会意识到这一刻的发生,但无论如何,一个用户是否经历了这一时刻,决定了他/她会成为你产品的留存用户还是流失用户。
北极星指标
北极星指标也叫唯一关键指标(OMTM,One metric that matters),产品现阶段最关键的指标,其实简单说来就是公司制定的发展目标,不同阶段会有不同的目标。为什么叫“北极星”指标,其实大概的寓意就是要像北极星一样指引公司前进的方向,目标制定最好是能符合SMART原则。
管理模型
ABC分析
ABC分类法(Activity Based Classification) ,全称应为ABC分类库存控制法。又称帕累托分析法或巴雷托分析法、柏拉图分析、主次因分析法 、ABC分析法、分类管理法、物资重点管理法、ABC管理法、abc管理、巴雷特分析法,平常我们也称之为”80对20”规则,EMBA、MBA等主流 商管教育均对ABC分类法对企业管理的启示及对管理者组织决策的影响有所介绍。
ABC分析实际上是一种管理方法,他把商品分成特别重要(A)、一般重要(B)、 不太重要(C)三个等级,然后针对不同等级分别进行管理和控制。
分类的核心思想:少数的项目贡献了大多数的价值。(类似常见的 二八法则)
以订货为例:
A类产品:
10%的款数贡献了60%的订货金额 B类产品:
30%的款数贡献了剩下的30%订货金额C类产品:
60%的款数贡献了剩下的10%订货金额
麦肯锡七步分析法
麦肯锡七步分析法又称“七步分析法”是麦肯锡公司根据他们做过的大量案例,总结出的一套对 商业机遇的分析方法。它是一种在实际运用中,对新创公司及成熟公司都很重要的思维、工作方 法。
PDCA
PDCA循环是非常强调目标、执行和反馈的,其核心理论是:
1. 目标导向:大环套小环、小环保大环、推动大循环;
2. 反馈机制:不断积累总结、不断提高。
SMART
mart 原则最早是由管理学大师 Peter Drucker 提出,这个方法不但有利于员工更加明确高效地工作,而且可以让上级更好的去考核手下的员工,这个原则大部分也适用于对自己目标的要求。
目标必须是具体明确的(Specific):所谓具体明确就是要用具体的语言清楚地说明要达成的行为标准。明确的目标几乎是所有成功团队的一致特点。很多团队不成功的重要原因之一就因为目标定的模棱两可,或没有将目标有效的传达给相关成员。
目标必须是可以衡量的 (Measureable):目标是明确的,应该有一组明确的数据,作为衡量是否达成目标的依据。
目标必须是可以达到的 (Attainable):目标是要能够被执行人所接受的,如果上司利用一些行政手段,利用权利性的影响力一厢情愿地把自己所制定的目标强压给下属,下属典型的反映是一种心理和行为上的抗拒。
目标必须和其它目标有相关性(Relevement):目标的相关性是指实现此目标与其他目标的关联情况。如果实现了这个目标,但对其他的目标完全不相关,或者相关度很低,那这个目标即使被达到了,意义也不是很大。
目标必须具有明确的截止期限(Time-based):目标特性的时限性就是指目标是有时间限制的。没有时间限制的目标没有办法考核,或带来考核的不公。适用场景:项目管理,目标管理
7S规则
整理(SEIRI):区分要与不要的东西,清除掉不需用的东西;
整顿(SEITON):对需要的东西定量、定位,对物品进行科学的、合理的布置和搁放,并有效的标识;
清扫(SEISO):把工作场所打扫干净,设备异常时马上修理,使之恢复正常;
清洁(SETKETSU):是对前面3S的坚持和深入,将前面3项活动规范化、制度化,惯窃执行并维持成功;
素养(SHITSUKE):坚持并养成良好的习惯;
安全(SAFETY):人身不受到伤害,环境没有危险,预防事故的发生;
节约(SAVE):对时间、空间、资源等方面合理利用,以发挥它们的最大效能,从而创造一个高效的,物尽其用的工作场所。
WBS工作分解
WBS英文全称为Work Breaddown Structure,也即工作任务分解方法。WBS分解遵循规则:目标->任务->工作->活动。
WBS分解的原则:将主体目标逐步细化分解,最底层的任务活动可直接分派到个人去完成;每个任务原则上要求分解到不能再细分为止。
WBS分解的方法:自上而下与自下而上的充分沟通;一对一个别交流;小组讨论。
WBS分解的标准:分解后的活动结构清晰;逻辑上形成一个大的活动;集成了所有的关键因素,包含临时的里程碑和监控点;所有活动全部定义清楚。
鱼骨图分析法
鱼骨图(Cause & Effect/Fishbone Diagram)又名特性因素图是由日本管理大师石川馨先生所发展出来的,故又名石川图。鱼骨图是一种发现问题“根本原因”的方法,它也可以称之为“因果图”。鱼骨图原本用于质量管理。
问题的特性总是受到一些因素的影响,我们通过头脑风暴找出这些因素,并将它们与特性值一起,按相互关联性整理而成的层次分明、条理清楚,并标出重要因素的图形就叫特性要因图。因其形状如鱼骨,所以又叫鱼骨图,它是一种透过现象看本质的分析方法,又叫因果分析图。 同时,鱼骨图也用在生产中,来形象地表示生产车间的流程
鱼骨图类型
整理问题型鱼骨图(各要素与特性值间不存在原因关系,而是结构构成关系,对问题进行结构化整理)
原因型鱼骨图(鱼头在右,特性值通常以“为什么……”来写)
对策型鱼骨图(鱼头在左,特性值通常以“如何提高/改善……”来写)
鱼骨图制作
分析问题原因/结构
a. 针对问题点,选择层别方法(如人机料法环测量等)。
b. 按头脑风暴分别对各层别类别找出所有可能原因(因素)。
c. 将找出的各要素进行归类、整理,明确其从属关系。
d. 分析选取重要因素。
e. 检查各要素的描述方法,确保语法简明、意思明确。
绘制鱼骨图
a. 由问题的负责人召集与问题有关的人员组成一个工作组(work group),该组成员必须对问题有一定深度的了解。
1. b. 问题的负责人将拟找出原因的问题写在黑板或白纸右边的一个三角形的框内,并在其尾部引出一条水平直线,该线称为鱼脊。
c. 工作组成员在鱼脊上画出与鱼脊成45°角的直线,并在其上标出引起问题的主要原因,这些成45°角的直线称为大骨。
d. 对引起问题的原因进一步细化,画出中骨、小骨……,尽可能列出所有原因。
e. 对鱼骨图进行优化整理.
f. 根据鱼骨图进行讨论。
鱼骨图使用步骤
分析问题原因/结构查找要解决的问题;
把问题写在鱼骨的头上;
召集同事共同讨论问题出现的可能原因,尽可能多地找出问题;
把相同的问题分组,在鱼骨上标出;
根据不同问题征求大家的意见,总结出正确的原因;
拿出任何一个问题,研究为什么会产生这样的问题;
针对问题的答案再问为什么,这样至少深入五个层次(连续问五个问题);
当深入到第五个层次后,认为无法继续进行时,列出这些问题的原因,而后列出至少20个解决方法。
5M因素分析法
所谓“5M因素分析法”,就是人们常说的从企业经营的五大环节,逐一进行认真分析,寻找企业的“症疾”并进行改进。
5M因素 包括人、机、料、法、环等5个方面。
人(Man)是指哪些问题是由人为因素造成的,主要分为自身因素、客户因素和竞争对手因素等;
机(Machinery)指软、硬件条件对于业务经营及管理的影响;
料(Material)指新产品的研制与开发、产品种类、性能及客户对产品的认知度等;
法(Method)是指业务经营的方式、方法是否正确有效等;
环(Milieu)是指影响业务经营的内部和外部环境等。
5M1E分析法
5M1E 是指造成产品质量的波动的原因主要有6个因素。
人(Man)操作者对质量的认识、技术熟练程度、身体状况等;
机器(Machine)机器设备、工夹具的精度和维护保养状况等;
材料(Material)材料的成分、物理性能和化学性能等;
方法(Method)这里包括加工工艺、工装选择、操作规程等;
测量(Measurement)测量时采取的方法是否标准、正确;
环境(Environment)工作地的温度、湿度、照明和清洁条件等;
工序质量受5M1E即人、机、料、法、环、测六方面因素的影响,工作标准化就是要寻求5M1E的标准化。
头脑风暴法
头脑风暴法(Brain Storming,BS法):又称智力激励法、或自由思考法(畅谈法,畅谈会,集思法),是一种通过集思广益、发挥团体智慧,从各种不同角度找出问题所有原因或构成要素的会议方法。
所谓头脑风暴(Brain-Storming),最早是精神病理学上的用语,指精神病患者的精神错乱状态而言的。而现在则成为无限制的自由联想和讨论的代名词,其目的在于产生新观念或激发创新设想。
头脑风暴法是由美国创造学家A·F·奥斯本于1939年首次提出、1953年正式发表的一种激发性思维的方法。
Brain Storming原则
严禁批评,延迟评判,不自谦
自由奔放,畅所欲言
多多益善,以量求质
搭便车,见解无专利
Brain Storming激发机理
联想反应
热情感染
竞争意识
个人欲望
组织形式
一般6~16人环桌而坐,主持人阐明问题,并保证每个人完全了解该问题。然后每个人各抒己见,充分发挥想象力,互相启发,发表自己想到的各种可能的选择方案。不允许任何批评,并且所有方案都当场记录,留待稍后再讨论和分析。一些技巧方法还是要实践出真知。
意义
克服群体压力抑制不同见解,鼓励创造性思维,这是一个产生思想的过程。
名义群体法
名义群体法(Nominal Group Technique, NGT),又称NGT法、名义团体技术、名目团体技术、名义群体技术、名义小组法。
名义群体法是指在决策过程中对群体成员的讨论或人际沟通加以限制,但群体成员是独立思考的。象召开传统会议一样,群体成员都出席会议,但群体成员首先进行个体决策。由AndrewH.VandeVen教授和A.L.AndreL.Delbecq教授在1968年开发的。
名义小组法适用于决策环境复杂,要通过个人偏好的汇总来进行小组的决策。它是一种主要适合于小型决策小组的方法。 Delbecq等人(1975)建议把名义小组方法用于5到8个成员组成的小组。因为,首先,对于这样大小的小组来说,小组的准确性是最好的;其次,互相影响研究表明,理想的小组大小是5到7个人;第三,名义小组的技巧不适用于大的小组。
组织形式
1. 成员集合成一个群体,但在进行任何讨论之前,每个成员独立地写下他对问题的看法;
1. 经过一段沉默后,每个成员将自己的想法提交给群体。然后一个接一个地向大家说明自己的想法,直到每个人的想法都表达完并记录下来为止(通常记在一张活动挂图或黑板上)。所有的想法都记录下来之前不进行讨论;
1. 群体现在开始讨论,以便把每个想法搞清楚,并做出评价;
NGT遵循原则
1. 需要事先做好充分的准备,活动过程中要组织得当。
1. 对任务的陈述要准确、清楚,并且要写在纸上以便所有人员都能够看见。
1. 认真完成每一个步骤,以避免减弱该方法的使用效果。
1. 监督每个讨论群体在规定的时间内完成每一步骤。
1. 整个活动过程要坚持公正平等的原则。
1. 确保活动参加者在讨论过程中提出的各项建议是积极而富有建设意义的
意义
这种方法可使群体成员正式开会,但不限制每个人独立思考,而传统会议方式往往做不到这一点。
德尔菲法
德尔菲法(Delphi Method)也称专家调查法,是一种采用通讯方式分别将所需解决的问题单独发送到各个专家手中,征询意见,然后回收汇总全部专家的意见,并整理出综合意见。随后将该综合意见和预测问题再分别反馈给专家,再次征询意见,各专家依据综合意见修改自己原有的意见,然后再汇总。这样多次反复,逐步取得比较一致的预测结果的决策方法。
德尔菲法依据系统的程序,采用匿名发表意见的方式,即专家之间不得互相讨论,不发生横向联系,只能与调查人员发生关系,通过多轮次调查专家对问卷所提问题的看法,经过反复征询、归纳、修改,最后汇总成专家基本一致的看法,作为预测的结果。这种方法具有广泛的代表性,较为可靠。
德尔菲法是在20世纪40年代由O.赫尔姆(Helmer)和N.达尔克首创,经过T.J.戈登(Gordon)和兰德公司进一步发展而成的。德尔菲这一名称起源于古希腊有关太阳神阿波罗的神话。传说中阿波罗具有预见未来的能力。因此,这种预测方法被命名为德尔菲法。1946年,兰德公司首次用这种方法用来进行预测,后来该方法被迅速广泛采用。
Delphi是古希腊的一座城市,位于中希腊的弗西斯境内的距雅典150公里的帕那索斯深山里,因有阿波罗神庙及其神托所而闻名,是世界闻名的著名古迹,古希腊人认为,Delphi是地球的中心,是“地球的肚脐”。
Delphi法典型特征
吸收专家参与预测,充分利用专家的经验和学识;
采用匿名或背靠背的方式,能使每一位专家独立自由地作出自己的判断;
预测过程几轮反馈,使专家的意见逐渐趋同。
德尔菲法的这些特点使它成为一种最为有效的判断预测法。
德尔菲法 最初产生于科技领域,后来逐渐被应用于任何领域的预测,如军事预测、人口预测、医疗保健预测、经营和需求预测、教育预测等。此外,还用来进行评价、决策、管理沟通和规划工作。
组织形式
1. 确定问题。通过一系列问卷设计,要求成员提供可能的解决方案。
1. 每个成员匿名,独立完成第一组问卷。
1. 第一组问卷结果集中编辑、誊写和复制。
1. 每个成员收到一本问卷集中结果复制件。
1. 成员根据集中结果再次提出方案(激发新方案或改变原有方案)。
1. 重复4、5两个过程直到取得大体一致的意见。
意义
非常有效的判断预测方法,避免召集人员的花费,又获得来自各专家的信息。但耗费时间长,不适用于快速决策。
电子会议分析法
电子会议分析法(electronic meetings)是一种名义群体法与复杂的计算机技术结合的群体决策方法。在使用这种方法时,先将群体成员集中起来,每人面前有一个与中心计算机相连接的终端。群体成员将自已有关解决政策问题的方案输入计算机终端,然后再将它投影在大型屏幕上。专家们认为,电子会议法比传统的面对面的会议快55%。
电子会议法的特点
匿名
可靠
快速
电子会议法的局限
那些善于口头表达,而运用计算机的技能却相对较差的专家来说,电子会议会影响他们的决策思维。
在运用这种预测方法时,由于是匿名,因而无法对提出好的政策建议的人进行奖励;
人们只是通过计算机来进行决策咨询的,从而是”人一机对话”,其沟通程度不如”人一人对话”那么丰富。
互动群体法有助于增强群体内部的凝聚力,脑力激荡法可以使群体的压力降到最低,德尔斐法能使人际冲突趋于最小,电子会议法可以较快的处理各种观点
OGSM计划法
OGSM是Objective(目的)、Goal(目标)、Strategy(策略)、Measurement(测量)的英文首字母组成。OGSM是一种计划与执行管理工具,一种制定策略计划的强大工具,以使业务集中在大的目的与目标,与关键策略上;一种实践策略的手段,以达成理想的目的与目标。通常用来制定公司的策略计划,即未来发展的蓝图。
制定OGSM的要点
你的基本目的是保证上级的目标的实现,当然还可以有自己认为重要的;
你的G应是你O的更细化、更精确化的描述,目标是尽量可以轻松考量的,G和O之间应有必要性和必定性的关系;
制定S时,我们往往会把有利于G实现的举措一五一十地搬出来,这是不对的——因为,你的资源是有限的,你无法把有用的举措一一实现,你必须找到帮助你达成G的最有ROI的一群举措!所谓策略,就是重点一些,放弃一些;
你的S和G之间,同样应具备必然性和必要性的关系;
最后扪心问问自己,这样做一定可以实现目的吗?可行吗?
用户体验
KANO模型
日本教授狩野纪昭(Noriaki Kano)构建出的kano模型。将影响用户满意度的因素划分为五个类型, 包括:
n 魅力因素:用户意想不到的,如果不提供此需求,用户满意度不会降低,但当提供此需求,用 户满意度会有很大提升;
n 期望因素(一维因素):当提供此需求,用户满意度会提升,当不提供此需求,用户满意度会降 低;
n 必备因素:当优化此需求,用户满意度不会提升,当不提供此需求,用户满意度会大幅降低;
n 无差异因素:无论提供或不提供此需求,用户满意度都不会有改变,用户根本不在意;
n 反向因素:用户根本都没有此需求,提供后用户满意度反而会下降;
用户行为理论
是指用户在使用产品所进行的一些行为,最常用的方法是时间轴查看法,也就是左为时间右为行为。主要就是为了查看活跃、普通、非活跃用户的行为对比,以及与自己设定的流程是否相符,同时优化流程和修改功能提供灵感。举例:下面说明5个行为走势
Fogg 行为模型
为了让用户的某个行为发生,产品需要具备三个特性:行为动机、执行能力和触发机制。
为了让一个行为发生,用户首先需要足够的动机和激励,然后得有执行动作的能力。用户具有充分的动机和足够的能力来执行的话,当触发机制出现的时候,操作就会自然而然地出现。这个简单的模型被成为 Fogg 行为模型
KISS复盘法
适用场景:项目质量管理
KISS是一种科学的项目复盘方法,以促进下一次活动更好的展开。
Keep可以保持的:复盘这次活动中做的好的,后续的活动能够继续保持的动作。
Improve需要改进的:那些环节/因素导致活动出现了不满意的地方,需要在后续活动中改进的。
Start需要开始的:哪些环节在本次活动中没有实施,而后续需要开始做的。
Stop需要停止的:哪些行为是对活动不利的,需要停止的。
尼尔森十大可用性原则
十大可用性原则由人机交互学博士尼尔森针对 web 设计提出,对 APP 设计亦有重要参考价值 。
状态可见性原则(Visibility of system status ):系统应该让用户知道发生了什么,在适当的时间内做出适当的反馈
环境贴切原则(Match between system and the real world ):系统应该用用户的语言,用词,短语和用户熟悉的概念,而不是系统术语。遵循现实世界的惯例,让信息符合自然思考逻辑。
撤销重作原则(User control and freedom):用户经常错误地选择系统功能而且需要明确标识离开这个的 “出口”,而不需要通过一个扩展的对话框。要支持撤销和重做的功能
一致性原则(Consistency and standards):遵循平台的惯例。同一用语、功能、操作保持一致。
防错原则(Error prevention):比出现错误信息提示更好的是更用心的设计防止这类问题发生。
易取原则(Recognition rather than recall):尽量减少用户对操作目标的记忆负荷,动作和选项都应该是可见的。用户不必记住一个页面到另一个页面的信息。
灵活高效原则(Flexibility and efficiency of use):中级用户的数量远高于初级和高级用户数。为大多数用户设计,不要低估,也不可轻视,保持灵活高效。
易扫原则(Aesthetic and minimalist design):互联网用户浏览界面的动作不是读,不是看,而是扫。易扫,意味着突出重点,弱化和剔除无关信息。
容错原则(Help users recognize, diagnose, and recover from errors):帮助用户从错误中恢复,将损失降到最低。如果无法自动挽回,则提供详尽的说明文字和指导方向,而非代码,比如 404。适用场景:产品设计
人性化帮助原则(Help and documentation):如果系统不使用文档是最好的,但是有必要提供帮助和文档。任何信息应容易去搜索,专注于用户的任务,列出具体的步骤来进行。帮助性提示最好的方式是:
无需提示;
一次性提示;
常驻提示;
帮助文档。
格式塔
格式塔理论是一个心理学名词,旨在解释人类的某些行为是如何产生的,也解释了我们人类的视觉经验如何与大脑的反应产生联系;主要由以韦特海默为首的一群来自奥地利及德国的心理学家,通过对重要的视觉现象总结观察而来,阐述了人的神经系统对外界输入的视觉信息自动感知、处理的特点。
观点:人们的审美观对整体与和谐具有一种基本的要求。简单地说,视觉形象首先是作为统一的整体被认知的,而后才以部分的形式被认知。通俗的讲我们先“看见”一个构图的整体,然后才“看见”组成这一构图整体的各个部分。
这个logo大家应该不陌生,我们在识别他的时候是不是先看到了一个整体的U然后才看到里面组合的各种元素。
如果去深入研究格式塔原理,可能需要相当长的时间来学习理解,作为视觉设计师,其实只要理解这几个原理的含义和使用方法,就可以对自己的设计做出指导和支撑了。
比如:接近性、相似性、闭合性、连续性、简单性、图形和背景。比较常见的是前面四条,也是我们视觉设计包括平面设计当中常用的四条。下面就来具体解读这些原理
接近性
距离/位置相近的元素趋于组成一个整体。
就像上图一样,由于两个圆之间的距离更近,一般我们首先看到的就是3组圆而不是6个独立的小圆。
这里要注意一点,相近性作为格式塔的首要原则,它的影响非常大,大到可以抵消其他原则,比如上图的圆形添加颜色,甚至改变其形状,人们也会把相近的事物当成一个整体。
这则原理在平时的视觉设计中应用比较广泛,比如上图的app列表页。设计师在设计的时候会有意识的将相似的功能聚合在一起,让其变成一个整体,使整个页面结构更加清晰便于理解。
相似性
在某一方面(大小、颜色、形状等)相似的元素趋于组成一个整体。
观察上图我们会发现有2种圆,而不是15个圆。这是因为我们的眼睛很容易关注那些外表相近的物体归为一组。
这里要注意一点,颜色作为相似性的参照依据要强于形状,因为相较于形状,醒目的颜色更能吸引人的注意力。比如上图中我们会首先将颜色鲜红的图标归为一个整体,其次再根据圆形的轮廓确定将上下两行功能图标归为一类。这样设计的好处是能让设计重点更加突出,同时又不破坏整体感。
闭合性
构成闭合造型的元素趋于组成一个整体。
观察上图我们会发现有1个圆圈,和1个点,而不是9个点。我们的视觉系统自动的尝试将敞开的图形封闭起来,从而将其感知为完整的物体而不是分散的碎片。比如文章开始的时候联合利华的logo就是运用了这条原理。
在页面设计过程中也有很多地方利用了这条原理。比如上图右侧的图片被不自然的切断了,但是用户可以通过残留的部分,脑补出右侧仍然有个完整的整体,这样用户很自然知道可以左滑查看更多的信息。
连续性
当发现一个视觉规律后,倾向于将对象按规律延续下去。
比如上面这张图,你首先会意识到这是一个圈、三条直线和一条曲线,我们从小就知道直线、圈和曲线,所以当我们看到这张图的时候,知觉上会弱化这些线条分割所带来的“块”,而依然意识到是由三条直线、一个圆、一条曲线组成的。
这条原理对设计师的启发在于,要为用户创建一个条形规律,辅助他阅读理解页面。像上图,用户可以通过阅读前三名的信息,组建出一条自己阅读规律方便后续的阅读。比如有些用户关注运动时常,这样他在阅读该信息的时候只需要关注最右侧的运动时间,因为时间都展现在右侧。
简单性
将复杂的视觉信息降低为更为简单的,更有对称性,更容易理解,更有意义的东西
比如上图,一般人更倾向于将左侧的图形理解为两个圆形,而不是右侧的两个形状。
这个原则在扁平风格当道的今天特别受用,比如上图,图标越来越简洁。
图形和背景
一定范围内,图形与背景对比越大,位置越突出,则图形越容易被发觉。
上图对比后会发现左侧的白色图形更容易被发现。
这条原理告诉我们图形与背景的对比越大就越明显,反之我们也可以降低对比度来弱化不重要的信息。比如上图顶部三个功能按钮使用明亮的颜色增加了图形与背景的对比度,是他比下面的功能更容易被发现。
总结
对于原理本身,因为他是由我们人类自己的神经系统感知图形的规律总结出来的东西,也就是说我们每个人潜意识里就具备这项技能,在解释原理的过程中你也会发现很容易理解,但是我们在构思设计的过程中往往会多于专注视觉效果的创作而忽略最基本的原理,也是PM和需求方经常反馈的问题。比如功能不够明显、页面杂乱、不舒服等等。
我们把原理归类、总结、记忆的目的有两个:一个是自我检查,这里包括设计之前进行有理有据的设计构思;设计过程中检查自己的设计作品,避免低级错误导致后期改稿和撕逼;再就是设计完成之后对需求方有理有据的陈述。第二个是在深入理解的前提下做设计时能够举一反三。
产品分析
5W1H分析法
5W1H分析法(Five Ws and one H)也称六何分析法,是一种思考方法,也可以说是一种创造技法。是对选定的项目、工序或操作,都要从原因(WHY)、对象(WHAT)、地点(WHERE)、时间(WHEN)、人员(WHO)、方法(HOW)等六个方面提出问题进行思考。这种看似很可笑、很天真的问话和思考办法,可使思考的内容深化、科学化。
5W2H
5W2H1E法
5W2H1E即:
What(什么)–企划的目的、内容。
Who( 谁)–企划相关人员。
Where( 何处)–企划实施场所。
When(何时)–企划的时间。
Why(为什么)–企划缘由、前景。
How(如何)–企划的方法和运转实施。
How much(多少)–企划预算。
Effect(效果)–预测企划结果、效果。
任何一种企划书的构成都必须有5W2H1E,共8个基本要素。尤其值得一提的是,要注意How much和Effect对整个企划案的重要意义。如果忽视企划的成本投入,不注意企划书实施效果的预测,那么,这种企划就不是一种成功的企划。只有5W1H的企划书不能称之为企划书,只能算是计划书。
意义
经常用这类方法有助于使思路条理化,杜绝盲目性。汇报工作也可用这个方法,节约读写报告的时间。
逻辑树分析法
战略分析常用的一个场景是新孵化项目的市场可行性分析,要解决的问题比较明确:新市场我们 是否可以切入?如何进入?开始的时候我们可以运用逻辑树把问题拆分成几个子议题,并据此制 定项目具体计划,识别核心关键问题,逐一分析。
同时在使用的时候要注意以下三个原则:
要素化:把相同问题总结归纳成要素。
框架化:将各个要素组合成框架、遵守不重不漏的原则。
关联化:框架内的各要素保持必要的相互关系,简单而不孤立。
缺点:涉及的相关问题可能有疏漏。
用户体验要素
出自《用户体验要素:以用户为中心的产品设计》,虽然原书介绍的是网站设计,但同样适用于移动产品。用户体验要素模型可以帮助我们梳理产品从 0 到 1 的 5 个阶段工作,也可以利用这 5 个方面对竞品进行分析。
金字塔原理
- 表达的逻辑
先说结论,后说论据,先总结所以,后过程因为。
塔尖面积最小,即一两句话说出结论,塔往下依次面积增大,即说明结论的论据。从上而下,先讲清论点,后论据支持。
02. 遵循四个基本原则
结论先行:表达一个中心思想,并置于最前;
以上统下:每一论点都是对下一层级论据的总结概括;
归类分组:每一组的思想属于同一逻辑范畴;
逻辑递进:每一组思想按照一定逻辑顺序排列。
3W黄金圈法则
思维模式处在最外层的人,知道自己要做什么「What」,却很少去思考怎么做才更好。
处在中间层的人知道如何「How」更好地完成任务和目标,却很少去思考做这件事的原因。
只有处于最中心圈的人,才清楚自己为什么「Why」做这件事情,Why是做这件事情的核心本质,其他都在围着这个圆心在转。
HMW
一、什么是HMW?
HMW,全称“How Might We”,即“我们可以怎样”,其中:
How:表示我们假设问题是可以解决的,只是我们尚不知道如何解决
Might:暗示现在讨论的想法不用太完美,支出大概有哪些方向即可,问题有无数的解法,我们可以有很宽广的创造空间
We:强调团队的重要性,不是单一成员的努力就可以解决问题,是需要整个团队的力量才可以解决这个问题
二、为什么要使用HMW?
可以改变我们固有的思维逻辑方式,防止自己圈定在一个圈层或者方向中,开拓自己的思维层面,不受单种方式的拘束,使得我们在同个问题上可以发散性地对多个方向进行剖析,确保创新者正在使用最佳的措辞提出正确的问题。
三、什么场景下可以使用到HMW?
头脑风暴之前:解决效率问题
分析用户反馈
和领导PK:用HMW分析领导的需求是什么,领导想到,你也想到的,还有方案
面对明确的用户和问题:一类明确的用户,碰到一类明确的问题
锻炼自我思维:碰到什么问题用产品思维分解
四、应用原理
1.明确用户和问题
用户问题:明确用户当前亟待解决的问题/痛点,透过问题的现象看到问题的本质需求;
产品价值:了解产品的核心价值定位可以帮助更好地去理解问题;
2.创建多个维度思考方向
发挥积极影响:我们可以怎样(利用XX问题让其他XX事情发挥出积极的作用)
移除消极影响:我们可以怎样(将XX问题和其他XXX隔离开)
逆向思维:我们可以怎样(把XX问题抽象出来的实际痛点问题变为可令用户愉悦)
质疑假设:我们可以怎样(完全除去XXX的问题?)
在形容词上下功夫:我们可以怎样(让XX变得“XXX”,而不是“xxx”)
找到没有预想过的资源:我们可以怎样(利用XXX的某个地方,分散xxx东西)
从需求或环境中创造类似体验:我们可以怎样(让XX变得“XXX”)
从问题出发应对挑战:我们可以怎样(设计XXX样的体验,让他们心情更愉悦)
改变现状:我们可以怎样(让XXX变得不那么烦人?)
把问题分成多个小任务
否定:如何让用户放弃这个想法积极:如何让用户提升自己来解决问题转移:如何让其他人解决这个问题,继而解决用户这个问题脑洞打开:以前不敢想的方案分解:把很大的问题分成2-3步
3.拆解成小问题并解答
发散思维进行头脑风暴,根据思考方向针对各个小问题提出多种解决方案,寻找最优方案;
4.分类排序
采用卡片分类法,根据用户量、频次、开发难度和见效快慢程度等问题进行评估,对这些需求的优先级进行排序;
优先级判断过程中我们遵循以下原则:基本型需求 > 期望型需求 > 兴奋型需求;
5.流程与原型设计
在梳理产品需求流程中我们可以采用用户故事法来辅助我们对流程进行梳理,既能方便开发理解也能帮助我们更清晰地梳理出用户诉求,发现不足之处,从中抽象出流程图或数据模型出来,而当流程梳理完毕后就是我们大家常知的原型设计了。
5.案例解析
挑战:在本地的国际机场,重新打造地面体验观点(POV):带着三个孩子的妈妈,急匆匆地冲进机场进站,结果却在门口等了好几个小时。这个时候她需要逗弄自己淘气的小孩儿们,因为这些“磨人的小妖精”只会激怒其他同样焦虑等待的同行乘客。
发挥积极影响:我们可以怎样 利用孩子的热情让其他乘客开心?
移除消极影响:我们可以怎样 将孩子和其他乘客隔离开?
逆向思维:我们可以怎样 把等待变为旅途中令人神往的一部分?
质疑假设:我们可以怎样 完全除去机场等候时间?
在形容词上下功夫:我们可以怎样 进机场变得“让人焕然一新”,而不是“急匆匆”?
找到没有预想过的资源:我们可以怎样 利用同行乘客的空闲时间,分散妈妈的负担?
从需求或环境中创造类似体验:我们可以怎样 让机场像 spa 中心?或者像游乐场?
从问题出发应对挑战:我们可以怎样 设计机场的体验(挑战),让孩子们(问题)愿意去机场玩?
改变现状:我们可以怎样 让淘气吵闹的熊孩子变得不那么烦人?
把问题分成多个小任务:我们可以怎样 让孩子开心?我们可以怎样 让带着 3 个孩子的妈妈放缓匆忙的脚步?我们可以怎样 安抚延误的乘客?
五、在产品设计中HMW的流程使用
问题:明确用户、场景问题(聚焦)
手段:HMW法分解问题(扩展)
方案:N44头脑风暴(发散)
优先级:卡片分类与排序(减法)
MVP:流程与原型设计(聚焦)
心理学模型
马斯洛需求层次理论
马斯洛需求层次理论是行为科学的理论之一,由心理学家亚伯拉罕·马斯洛在《人类激励理论》论文中提出。该理论将人类需求从低到高按层次分为:生理需求、安全需求、社交需求、尊重需求和自我实现需求。
通俗理解:假如一个人同时缺乏食物、安全、爱和尊重,通常对食物的需求量是最强烈的,其它需要则显得不那么重要。只有当人从生理需要的控制下解放出来时,才可能出现更高级的、社会化程度更高的需要如安全的需要。
皮格马利翁效应
罗森塔尔效应,亦称“皮格马利翁效应”、“人际期望效应”,是一种社会心理效应,指的是教师对学生的殷切希望能戏剧性地收到预期效果的现象。由美国心理学家罗森塔尔和L.雅各布森于1968年通过实验发现。一般而言,这种效应主要是因为教师对高成就者和低成就者分别期望着不同的行为,并以不同的方式对待他们,从而维持了他们原有的行为模式。
邓宁-克鲁格效应/达克效应
一幅是邓宁-克鲁格效应,如下图——请略去“绝大多数中国人区间”这行字,我不同意。邓宁-克鲁格是美国著名的认知心理学家。以他名字命名的达克效应(D-K effect)是一种认知偏差,是指能力欠缺的人有一种虚幻的自我优越感,错误地认为自己比真实情况更加优秀。简言之即:庸人容易因欠缺自知之明而自我膨胀。(摘自vikipedia)
营销模型
4P营销理论
产品(product)、价格(price)、渠道(place)、促销(promotion)
产品(product):从市场营销的角度来看,产品是指能够提供给市场,被人们使用和消费并满足人们某种需要的任何东西,包括有形的产品、服务、人员、组织、观念或它们的组合。反应在互联网产品上就体现在产品所能带给用户的服务体验、节省时间、空间、信息、交通、社交等所创造的价值。
价格(price):是指用户消费时的价格,包括基本价格、促销价格、折扣价格、支付期限等。价格决策关系到企业的利润、成本补偿,以及斯否有利于产品促销等问题。同时展现在app上的特点在于,你要展现产品的原价、所要优惠的形式,如:9折、减100、满500减50、优惠卷等;最重要的是要在用户最终支付的价格要显示清楚。影响定价的主要三因素:需求、成本、竞争。最高价格取决于需求,最低价格取决于该产品的成本价,在最低与最高之间定价,取决于竞品价。
渠道(place):是指产品开发出来,传播流转到用户手中(用户手下载公司的app),全过程中所经历的各个环节。比如:广告、搜索、推荐、社群、还有最不好的类似于网赚渠道下载的app。
促销(promotion):是指企业通过改变销售行为来刺激用户消费,以短期的行为促进销售的增长。如:摩拜和ofo的免费骑行,现在摩拜的骑行红包,还有各电商类的双十一等。
4P营销理论是了解公司的整体运营情况,就可以采用此方法。
STP理论
STP目标市场营销由S市场细分(Segmenting)、T目标市场(Targeting)和P市场定位(Positioning)构成。
1、市场细分
以顾客需求差异类型,将市场中某产品/服务进行细分。
2、目标市场
根据市场细分,确认产品/服务想进入的一个或多个细分市场。
3、市场定位
根据产品/服务的关键特征及卖点进行包装,确认自己的产品/服务在市场上的竞争地位。
STP适合企业在了解内外部环境及优劣势的情况下,依据自身情况针对性去做细化业务的精准决策。
AISAS模型
AISAS模型是一种用户决策分析模型,由电通公司提出。这个模型是基于AIDMA模型,是消费者行为学领域很成熟的理论模型之一。
这个模型的理论认为消费者从接触到信息到最后达成购买会经历Attention(引起注意)、Interest (引起兴趣)、Desire(唤起欲望)、Memory(留下记忆)、Action(购买行动)这五个阶段。这个理论可以很好的解释在实体经济中的购买行为。
AIPL模型
(首次实现品牌人群资产定量化、链路化运营)
“品牌人群资产”很重要,是大家都知道的。比如可口可乐的传奇总裁罗伯特伍德鲁夫说:即使可口可乐全部工厂都被大火烧掉,给我三个月时间,我就能重建完整的可口可乐。
这位总裁为什么敢有如此豪言?
最重要的是可口可乐品牌有强大的消费者人群资产,那些听过可口可乐的人、喝过的人、一年买很多次的人。
放在过去,“人群资产”是一个很难量化统计的概念。我们只能定性说可口可乐的人群资产一定比康师傅的多,但是具体有多少是不知道的。
于是,阿里就推出了一个可以把品牌在阿里系的人群资产定量化运营的模型,这也是支撑它全域营销概念落地的关键一环,这个模型叫做:A-I-P-L。
A(Awareness),品牌认知人群。包括被品牌广告触达和品类词搜索的人;
I(Interest),品牌兴趣人群。包括广告点击、浏览品牌/店铺主页、参与品牌互动、浏览产品详情页、品牌词搜索、领取试用、订阅/关注/入会、加购收藏的人;
P(Purchase),品牌购买人群,指购买过品牌商品的人;
L(Loyalty),品牌忠诚人群,包括复购、评论、分享的人。
FAST模型
如果说AIPL是帮助商家了解品牌人群资产总量,以及各链路人群的多少,那么FAST就是在此基础上,又从数量和质量两个维度,来衡量品牌在人群资产运营是否健康的模型。
该指标主要帮助品牌了解自身的可运营消费者总量情况, 首先利用 GMV 预测算法,预估品牌消费者总量缺口,然后基于缺口情况优化营销预算投入,站内外多渠道种草拉新,为品牌进行消费者资产扩充;并指导品牌进行未来的货品规划和市场拓展,多方位拓展消费者;
A (Advancing),指AIPL人群转化率。多场景提高消费者活跃度,促进人群链路正向流转;多渠道种草人群沉淀后,进一步筛选优质人群,通过钻展渠道进行广告触达;品牌内沉淀人群细分,对消费者进行分层运营,差异化营销,促进整体消费者的流转与转化;
S(Superiority),高价值人群总量-会员总量。会员/粉丝人群对于品牌而言价值巨大,能够为品牌大 促提供惊人的爆发力;通过线上线下联动、联合品牌营销,以及借助平台的新零售等场景如天猫 U 先、淘宝彩蛋、智能母婴室扩大品牌的会员/粉丝量级,为后续的会员/粉丝运营打下基础;
T(Thriving),高价值人群活跃率-会员活跃率。借势大促,提高会员/粉丝活跃度,激发会员/粉丝 潜在价值,为品牌 GMV目标完成提供助力;对会员/粉丝按照 RFM 指标进行分层运营,优化激活效率,千人千权触达惩戒,公私域结合,赋能会员/粉丝运营;
FAST体系在数量指标层面,提供全网消费人群总量(Fertility)和高价值人群-会员总量 (Superiority);在质量指标层面,提供了人群转化率 (Advancing)和会员活跃率 (Thriving)
GROW模型
(指导大快消行业品类有的放矢的增长模型)
增长,应该是营销人永恒的课题。特别是在互联网流量红利见顶下的存量时代,增长变得愈发的“难”。通常难在3个地方:找不到帮助品类增长的方向、缺乏明确的品类增长抓手、品类增长效率较低。
于是,作为如今定位为商业操作系统的阿里,就提出了适用于母婴、食品、家清、美妆、医药保健和个护等几大一级类目的大快消行业增长“仪表盘”——GROW模型。GROW中的4个单词分别代表着影响品类增长的“决策因子”:
渗透力(Gain): 指消费者购买更多类型品类 / 产品对品牌总增长机会的贡献;
复购力(Retain): 指消费者更频繁 / 重复购买产品对品牌总增长机会的贡献;
价格力(bOOst): 指消费者购买价格升级产品对品牌总增长机会的贡献;
延展力(Widen): 指品牌通过提供现有品类外其他关联类型产品所贡献的总增长机会。
对于不同的品类,拥有对应的GROW指数,即根据 (G)、 (R)和 (O)对各自的 GMV贡献计算出各自的G/R/O 的值。这个是指导对应品类在增长上的发力方向。
比如:
母婴行业的品类渗透力(G)明显高于其他因子
食品和家清行业的复购力(R)机会突出
美妆和医药保健行业的价格力(O)机会最大
个护行业各方面增长机会均匀,渗透力(G)的机会略高
除了每个一级类目的GROW指数,品牌还可以通过品类地图,查询旗下各二级类目的增长方向,如下图:
比如:食品类目中最适合提升渗透力的前10大二级类目有哪些、最适合做价格力提升的有哪些;美妆行业中最适合提升渗透力的有哪些……
这个品类地图,特别是对于一些旗下有各种类目的品牌是非常有帮助的,可以按图索骥地找到每个类目的增长发力点。
接下来,我们来说说如何提升GROW中每一个指数的落地策略。
渗透力(Gain):
G1:延展目标人群驱动品类渗透。瞄准行业核心人群(前 30%)、渗透下沉市场以及细 分长尾人群(小镇青年、Z 世代等)。
G2:跨品类交叉渗透。识别高相关品类,结合站内联合营销,通过打造关联品类 / 品牌 (CP)进行渗透;加强线上线下全渠道消费者数据融合,提升渗透力。
G3:多渠道联动渗透。品牌各渠道消费者相互导流,对消费者进行全渠道触达渗透。
复购力(Retain):
R1:品类消费生命周期延长。防止购买人群流失,例如在防晒霜的消费者沟通中 , 强调 全年防晒,推送日常抗老信息。R2:品类使用场景拓展。通过挖掘细分场景需求以及培养新的消费习惯,增加复购频次。R3:高频再购的触发。通过匹配高复购人群和高复购产品, 结合营销手段, 激发再次购买。:价格力(bOOst)
O1:老客的再购升级。低客单老客的再购升级,高价值老客的客单提升。
O2:产品包装升级。通过包装升级撬动价格升级。
O3:基于情感诉求实现溢价。营销加持抬高产品溢价,侧重打造产品卖点。
O4:功能 / 属性升级。通过产品升级重新定义行业产品的价格带 / 区间。
延展力(Widen):
W1:行业趋势分析识别新品类机会。分析和捕捉更好的市场机会,分析品类生命周期 特征,结合市场吸引力及品牌自设能力,制定进入新行业 / 品类业务的策略。
W2:人群需求定位帮助品类开拓。洞察人群需求,行业新品类的孵化和创新,填补现 有购买人群未满足的品类空白。
W3:产品价值链衍生发掘新品类。结合品牌自身产业价值链能力,依据价值链衍生方向,识别和进入新品类市场。
OIIC
适用场景:方案撰写 客户沟通
理论来源:SAATCHI & SAATCHI
理论全称:O丨Objective 目标,I丨Issue 障碍,I丨Insight 洞察,C丨Challenge (应对挑战的)解决方案
在写方案的时,首先要明白客户的生意目标是什么?为了达成这个目标,目前面临的阻碍是什么?
针对这个障碍,我们对消费者进行洞察,找到和消费者沟通的核心方向。
基于此,找到清除消费者障碍我们的Action是什么?而这个Action本身就是一个挑战。
4C营销理论
适用场景:商业模式
理论来源:1990年 美国学者罗伯特·劳特朋
理论全称:C丨顾客 Consumer ,C丨成本 Cost,C丨方便 Convenience,C丨沟通 Communication
随着竞争的不断加剧,当产品供过于求时,企业应该从产品本位转移到消费者本位。
即从产品(Production)向顾客(Consumer)转变,价格(Price)向成本(Cost)转变,分销渠道(Place)向方便(Convenience)转变,促销(Promotion)向沟通(Communication)转变。
企业首先要以消费者需求为始,生产出让顾客满意的产品,同时降低消费者购买成本。
在消费者获取产品时,还要考虑到消费者购买的便利性,而不是从企业的层面考虑分销渠道,最后还要以消费者为核心进行有效的沟通,并注重消费者的反馈。
HBG
适用场景:品牌营销
理论来源:Bryon Sharp教授
理论全称:How brands grow
HBG揭示了用户购买和销售增长的模式。这种模式可以表达为一个公式:品牌增长=渗透率 X 想得起 X 买得到,即大品牌、大媒体、大渠道。
也就是说,想要实现品牌增长,首先要提高产品的渗透率,然后要让消费者在产生需求的时候想得到你,之后产生购买欲望,还要能买得到你的产品。
P/MF
适用场景:产品上市
理论来源:马克·安德森
理论全称:Product / Market Fit 产品符合市场需求
用更好的产品体验满足一个已有的市场
需求已经存在,但需要体验更好的产品;P/MF:提供体验更好的产品;重点:非常好的用户体验+大量营销推广投入;eg. 瑞幸咖啡。
用一个产品满足已有但部分需求未被满足的市场
用户的部分需求未被满足;P/MF:满足用户的细分需求;重点:用更加精细的营销推广策略来吸引新用户;eg. Uber。
用一个产品满足一个新的市场
做这类产品无疑会遇到重重障碍,因为在产品诞生之前,用户不知道自己需要这种产
品,因此需求是不存在的、市场也是不存在的。此时,用产品创造新市场。
P/MF:基于已有需求创新。重点:有价值的用户体验,说服用户去体验,激发用户已有需求,并形成一种火爆现象。eg. 微博(以微博为例。微博的流行,让多数人不曾想象到与名人或品牌的互动,可以通过“@一下”实现。)
安索夫矩阵
适用场景:营销策略分析
理论来源:1975年 策略管理之父安索夫博士
安索夫矩阵又被称为产品市场扩张方格,是一种常用的营销分析工具。以产品和市场作为横纵坐标,组成2X2矩阵,分成四种产品/市场组合,以及相对应的营销策略。
现产品服务现市场,通过市场渗透增加市场份额;市场渗透:
现产品服务新市场,找到现有产品独特卖点,开发消费者需求的新市场;市场开发:
新产品服务现现场,找到现有顾客的新需求;产品开发:新产品服务新市场,竞争系数小,风险最大,收益也最大。多元化:
内容营销5A模型
适用场景:内容营销
理论来源:阿里数据 生意参谋 第一财经商业数据中心
该体系以“现代营销之父”菲利普·科特勒的“5A客户行为路径”为理论基础,梳理出内容能见度、内容吸引度、内容引流力、内容获客力、内容转粉力共5个维度的数据指标。
可用于评估内容营销对消费者的5重影响——了解(Aware)、吸引(Appeal)、问询(Ask)、行动(Act)、拥护(Advocate),帮助品牌全链路、分场景追踪内容营销效果,进行针对性提升与优化。
SICAS模型
2.0+移动互联的全数字时代,用户行为\消费触点变革为SICAS模型 [1] ,即:Sense— Interest&Interactive—Connect&Communicate—Action—Share
MOT模型
消费者时刻(Moment of Truth,简称MOT)是消费者旅程中的一些关键“里程碑”似的节点。例如,搜索某个产品,又或者把这个产品的信息分享给其他人。这个概念最初来源于宝洁
MOT中又有一类是非常重要的,即ZMOT(Zero Moment of Truth,原初MOT),意思是在某种情况的刺激下,一个人最初的一个心理上的活动,让他意识到他需要购买某个东西或者服务。对于Google而言,这个心理上的活动体现为在搜索引擎上进行搜索。对于阿里而言,这个心理活动起始于一个人开始了一个一段时间内从未有过的某类商品的搜索。
另外一个MOT是UMOT(Ultimate Moment of Truth),即最终的MOT,人们在整个购物历程中的最后一个关键时刻,往往就是把自己的商品体验分享出去的时刻。ZMOT和UMOT的思想来自于谷歌。
数据分析模型
基于用户生命周期的数据分析体系
基于用户生命周期的数据分析体系
与用户生命周期各阶段对应的关键指标:
漏斗模型
简单来说,漏斗模型就是通过产品每一个设计步骤的数据反馈得出产品的运行情况,然后通过各阶段的具体分析改善产品的设计,提升产品的用户体验。
用户模型
“不仅要知道用户当下在想什么,更要知道用户背后在想什么,以及用户正在经历着什么。”
传统用户模型构建方式
用户模型:基于对用户的访谈和观察等研究结果建立,严谨可靠但费时;
临时用户模型:基于行业专家或市场调查数据对用户的理解建立,快速但容易有偏颇。(缺乏时间,资源的情况下)
为了节省时间,降低风险,产品团队往往尽快将产品推向用户,快速试错,在这种场景下如何构造用户模型?
1,首先,整理和收集已经获得的任何可认知用户的经验和数据,将这些信息映射成为用户的描述信息(属性)或用户的行为信息,并存储起来形成用户档案,
2,实时关注自身数据的波动,及时采取行动
3,记录用户的行为数据而不是单纯地为用户打标签
4,360°覆盖用户全生命周期的用户档案
用户的每一步成长都通过行为记录下来,基于用户所在生命周期的不同阶段,针对新用户、流失用户、活跃用户、沉默用户分别采取有针对性的拉新、转化、留存等运营策略。
事件模型
1.事件是什么
就是用户在产品上的行为,它是用户行为的一个专业描述,用户在产品上的所有获得的程序反馈都可以抽象为事件,由开发人员通过埋点进行采集,通俗讲就是:将一段代码放入对应的页面/按钮,用户进入页面/点击按钮的本质是在加载背后的代码,同时再加载事件采集代码,这样就被SDK所记录下来了。
(利用百度统计加入代码采集用户下载成功和失败事件)
2.事件的采集
事件:用户在产品上的行为
属性:描述事件的维度
值:属性的内容
采集时机:用户点击(click)、网页加载完成、服务器判断返回等。在设计埋点需求文档时,采集时机的说明尤为重要,也是保证数据准确性的核心。
举个例子,在采集过程中如果没有明确时机,当用户点击了注册按钮,由于用户输入了错误的注册信息实际没有注册成功,可能仍然会进行记录,这样在统计注册成功事件的时候就不是准确的。而正确的采集时机描述应该是“服务器返回注册成功的判断”。(日本官网采集的就是返回激活成功或者失败页面)
3.事件的分析
人数:某一事件(行为)有多少人触发了
次数:某一事件(行为)触发了多少次
人均次数:某一事件(行为)平均触发多少次
活跃比:在一个时间区间内,触发某一事件的人数占当前时间段内所有活跃人数的比
4.事件的管理
当事件很多时,可以对事件进行分门别类地管理。同时,可以从产品业务角度将重要的用户行为标注出来,以便可以在分析时方便、快捷地查找常用、重要的事件。
热图分析模型
什么是热图分析模型?
反映用户在网页上的关注点在哪里,尤其对于官网首页来说,信息密度极高,用户究竟是如何点击,如何浏览的效果图
按计算维度划分,热图可以分为点击热图和浏览热图。
点击热图:追踪的是鼠标的点击情况,进行人数、次数统计并基于百分比进行热力分布,点击热图又分为两种,一种是鼠标的所有点击,一种是页面可点击元素的点击。前者可以追踪页面上所有可点击和不可点击位置的被点击情况,后者只追踪页面上可点击元素的点击情况。
浏览热图(也称注意力热图)记录的是用户在不同页面或同一页面不同位置停留时间的百分比计算,基于停留时长。
热图分析模型中的新特性
1、面向特定人群的分析与人群对比
比如理财产品,投资用户和未投资用户关注点肯定不同
2、聚焦分析
点击率= 点击次数/当前页面的浏览次数
聚焦率=点击次数/当前页面的点击总次数
应用场景
1、落地页效果分析
2、首页流量追踪
3、关键页体验衡量(产品体验和下载页面)
自定义留存分析模型
留存定义和公式
定义:满足某个条件的用户,在某个时间点有没有进行回访行为
公式:若满足某个条件的用户数为n,在某个时间点进行回访行为的用户数为m,那么该时间点的留存率就是m/n
N-day留存,即第几日留存,只计算第N天完成回访行为的用户
Unbounded留存(N天内留存),留存会累计计算N天内所有完成过回访行为的用户。
-Bracket留存 (自定义观察期留存)N-day留存和Unbounded留存都是按照独立的天/周/月为观察单位计算,但有时候我们不希望受限于这种固定时间度量,我们希望划分为几个观察期
第一个观察期:次日
第二个观察期:第3日-第7日
第三个观察期:第8日-第14日
第四个观察期:第15日到第30日
自定义留存
上述三种留存方式,都是对时间的限定,对留存的定义都是用户打开了APP或进入了网站
自定义留存是基于业务场景下的留存情况,比如阅读类产品会把看过至少一篇文章的用户定义为真正的留存用户,电商类产品会把至少查看过一次商品详情定义为有效留存
初始行为:初始与回访是相对的概念。
回访行为:与初始行为的设定是并且关系。用户的初始行为可以理解为上一次行为,回访行为即理解为下一次行为。
对初始行为和回访行为的设定本质上是在进一步筛选用户群。在滴滴的一次增长分享会曾提到过“抢了红包的用户后来打了车的日留存”,即初始行为是抢了红包,回访行为是打了车。“抢了红包的用户打了车的3日留存”即初始行为是抢了红包,回访行为是打车,看这部分人的第三天留存。
粘性分析
定义:对活跃用户使用产品的习惯的分析,例如一个月使用了几天,使用大于一天,大于七天的用户有多少,例如某些产品上线了新功能,用户使用需要签到,可以由此分析出用户的使用习惯,评估新功能的吸引力和健康度。
作用:使用留存分析,了解产品和功能黏住用户的能力如何,用户喜欢哪个功能,不同用户在同一功能在适用上的差异,有助于科学评估产品,制定留存策略
举例:股票APP,已投资用户和未投资的用户触发功能【查看股票市场】的次数
全行为路径分析
行为路径分析分为漏斗分析和全行为路径分析。与漏斗分析模型不同,漏斗分析模型是分析既定的行为转化,例如电商产品,分析从查看产品详情到最终支付每一步的转化率。而全行为路径分析是对用户在APP或网站的每个模块的流转情况,挖掘用户的访问模式,从而优化产品或网站
一般可用树形图表现,如下图,一个线上培训网站,用户大都会打开搜索课程,所以需要优化搜索课程。而在第一次搜索课程后,用户并没有搜索到想要的课程,又进行了第二次搜索,因此可以将用户搜索频率高的关键词设置成可点击元素,链接到用户使用频率高的相关课程。引导用户点击得到想要的结果
用户分群模型
分群是对某一特征用户的划分和归组,而分层,更多的是对全量用户的一个管理手段,细分用户的方法其实我们一直在用,比如我们熟悉的RFM模型:
RFM模型是从用户的业务数据中提取了三个特征维度:最近一次消费时间(Recency)、消费频率(Frequency)、消费金额 (Monetary)。通过这三个维度将用户有效地细分为8个具有不同用户价值及应对策略的群体,如下图所示
另外四个用户分群的维度:
1、用户属性:用户客观的属性,描述用户真实人口属性的标签,比如:年龄、性别、城市、浏览器版本、系统版本、操作版本、渠道来源等就是用户属性
2.活跃时间
3.做过,没做过
4.新增于:何时新增用户较多
矩阵分析法
矩阵分析法是指根据事物(如产品、服务等)的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法,也称为矩阵关联分析法,简称矩阵分析法
矩阵关联分析法在解决问题和资源分配时,可以为决策者提供重要参考依据——先解决主要矛盾,再解决次要矛盾,这样有利于提高工作效率,并将资源分配到最能产生绩效的部门、工作中,最终有利于决策者进行资源优化配置。
比如在电商行业,我们可以使用浏览量和加购数这两个维度来进行矩阵分析,如图所示,左上角的是浏览量低的,然后加购次数多的,这说明产品其实是有很大潜力的,这时需要将这部分产品放在更好的位置让给用户进行浏览;右下角的浏览量高,但加购数低的,说明这个时候他的资源位置是好的,但是用户对这部分的产品并不感兴趣的,我们就需要对其进行相应的位置调整。
关联分析法
关联分析法是一种简单、实用的分析技术,是指从大量数据集中发现项集之间的关联性或相关性。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联等。
关联分析的一个典型例子是购物篮分析。该过程通过发现顾客放入其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划分。
可从数据库中关联分析出形如”由于某些事件的发生而引起另外一些事件的发生”之类的规则。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的“啤酒和尿布”的货架摆放或捆绑销售可提高超市的服务质量和效益
指标分析法
在实际工作中,当拿到一些可视化数据图表或者是Excel表格时,我们可以直接运用统计学中的一些基础指标来做数据分析,比如平均数、众数、中位数、最大值、最小值等,下面我们分别来介绍:
1.平均数
平均数、也叫平均分析法,是指运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平的分析方法。平均分析法常用指标有算术平均数、调和平均数、几何平均数、众数和中位数等,其中最为常见的是算术平均数,也就是日常所说的平均数或平均值。
平均数指标可用于对比同类现象在不同地区、不同行业、不同单位等之间的差异程度,比用总量指标对比更具说服力。除此以外,利用平均指标对比某些现象在不同历史时期的变化,也更能说明其发现趋势和规律。
比如,汽车行业的自媒体如果想要分析数据,可从两个方面来分析:①外部:行业内整体公众号的平均打开率是多少,我们距离行业平均水平相差多少,该如何去做一些优化;②内部:针对每个月都在尝试的各种选题和内容运营策略,可以分析本月比上月平均打开率又增加了多少,这个月的选题是否有一些爆款,爆款文章平均打开率是多少,标题有什么特点等等。
2.众数、中位数
众数也就是数据中的一种代表数,它反应的是数据的一种集中程度。比如说最佳,最受欢迎,最满意都与众数有关。众数本质上来说,反映的是数据中发生频率最高的一些数据指标,在做数据分析时,我们可以对这些数据指标提取一些共性的特点,然后进行提炼和总结,然后得出一些改进的意见。
中位数主要是反映的是一组数据的集中趋势,像我们比较常见的正态分布,比如说我们想去统计某市的人均收入,其实,大部分的人均收入都是在一定范围之内的,只有少部分是处于最低的和最高的,其实这是中位数带来的意义。
在做数据分析时,如果各个数据之间的差异程度较小,用平均值就有较好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性。
3.最大(小)值
最大(小)值在平时做数据分析工作时比较常见,只是我们没有特别去注意。最值是作为典型代表和异常值进行分析的,比如说销售团队里的销售冠军,电商爆款商品等,如图所示,我们可以将销售额最大的几款商品提出来,然后我们去总结共性,找到原因,然后复制到其他的商品,最终提高平均转化率。
对比分析法
对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。它可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少?对比分析法可分为静态比较和动态比较两类。
静态比较:在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较、也叫横向比较,简称横比;
动态比较:在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比。
这两种方法既可单独使用,也可结合使用。
进行对比分析时,可以单独使用总量指标、相对指标或平均指标,也可将它们结合起来进行对比。比较的结果可用相对数表示,如百分数、倍数等指标。
在使用对比分析法时,需要先注意以下几个方面:①指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准去衡量;②对比的对象要有可比性;③对比的指标类型必须一致。无论绝对数指标、相对数指标、平均数指标,还是其他不同类型的指标,在进行对比时,双方必须统一。
1.时间维度对比
同一指标在不同时间维度下的对比,如同比、环比、定基比等。同比就是与去年的同一个时间段进行对比分析,可以是季、月、周、天;环比就是和上一个时间段来对比(也有和下一个时间段对比的,也叫后比),例如本月和上月,本周和上周对比;定基比是和某个指定的时期进行对比分析,比如2013年每个月都和2013年1月的销售额进行对比取值。
如图为各月销售额对比,时间范围一致(均为月汇总)、指标一致、指标含义一致、其表现的为整个企业信息,总体性质可比。
2.空间对比
就是不同空间数据的对比,比如华北区和华南区对比,北京和上海,上海古北店和成都春熙路店进行对比。相似空间的对比对象必须是形态上比较接近,先进空间则是和同一种形态中的优秀空间进行对比,与扩大空间的对比,比如北京和全国的数据对比,北京王府井店和全北京的数据对比,和竞争对手的对比也在此列。
如图为2018年全年各销售小组销售额对比,其对比的时间范围一致、指标一致、指标含义一致、维度为各个销售小组,具有相同性质。
3.计划对比
和计划标准的对比是销售追踪中非常重要的一环,所有的绩效考核都是计划标准,例如销售实际达成金额与销售计划达成金额对比,看销售是否完成当初指定的计划,如果没有完成,原因在哪里。
4.与经验值或理论值对比
其中的经验标准是在大量的实践过程中总结出来的值,而理论标准则是根据理论推断出来的值,平均值则是某一空间或时间的平均值。如,一单一品率:所有销售小票中只有一个商品的小票数量占比。参考值为小于40%,如果数据超过了40%,则需要考虑如何调整策略,帮助客户做关联购买。而参考值小于40%,就是一个理论值。
埋点分析
通过分析用户行为,并细分为:浏览行为,轻度交互,重度交互,交易行为,对于浏览行为和轻度交互行为的点击按钮等事件,因其使用频繁,数据简单,采用无埋点技术实现自助埋点,即可以提高数据分析的实效性,需要的数据可立即提取,又大量减少技术人员的工作量,需要采集更丰富信息的行为。
聚类分析
聚类分析具有简单,直观的特征,网站分析中的聚类主要分为:用户,页面或内容,来源。
用户聚类主要体现为用户分群,用户标签法;页面聚类则主要是相似,相关页面分组法;来源聚类主要包括渠道,关键词等。
例如:在页面分析中,经常存在带?参数的页面。比如:资讯详情页面,商品页面等,都属于同一类页面。简单的分析容易造成跳出率,退出率等指标不准确的问题,通过聚类分析可以获取同类页面的准确数据用于分析场景。
AB测试
增长黑客的一个主要思想之一,是不要做一个大而全的东西,而是不断做出能够快速验证的小而精的东西。快速验证,那如何验证呢?主要方法就是AB测试。
比如:你发现漏斗转化中中间有漏洞,假设一定是商品价格问题导致了流失,你看到了问题-漏斗,也想出了主意-改变定价。但主意是否正确,要看真实的用户反应,于是采用AB测试,一部分用户还是看到老价格,一部分用户看到新价格,若你的主意真的管用,新价格就应该有更好的转化,若真如此,新价格就应该确定下来,如此反复优化。
趋势分析
趋势分析是最简单、最基础,也是最常见的数据监测与数据分析方法。通常我们在数据分析产品中建立一张数据指标的线图或者柱状图,然后持续观察,重点关注异常值。
在这个过程中,我们要选定第一关键指标(OMTM,One Metric That Metter),而不要被虚荣指标(Vanity Metrics )所迷惑。
以社交类APP为例,如果我们将下载量作为第一关键指标,可能就会走偏;因为用户下载APP并不代表他使用了你的产品。在这种情况下,建议将DAU(Daily Active Users,日活跃用户)作为第一关键指标,而且是启动并且执行了某个操作的用户才能算上去;这样的指标才有实际意义,运营人员要核心关注这类指标。
多维分解
多维分解是指从业务需求出发,将指标从多个维度进行拆分;这里的维度包括但不限于浏览器、访问来源、操作系统、广告内容等等。
为什么需要进行多维拆解?有时候一个非常笼统或者最终的指标你是看不出什么问题来的,但是进行拆分之后,很多细节问题就会浮现出来。
举个例子,某网站的跳出率是0.47、平均访问深度是4.39、平均访问时长是0.55分钟。如果你要提升用户的参与度,显然这样的数据会让你无从下手;但是你对这些指标进行拆解之后就会发现很多思路。
分布分析模型
分布分析是用户在持续指标下的频次、总额等的归类展现。它可以展现出单用户对产品的依赖程度,分析客户在不同地区、不同时段所购买的不同类型的产品数量、购买频次
等,帮助运营人员了解当前的客户状态,以及客户的运转情况。如订单金额(100以下区间、100-200元区间、200元以上区间)、购买次数(5次以下、5-10次、10次以上)
点击分析模型
即应用一种特殊高亮的颜色形式,显示页面或页面组(结构相同的页面,如商品详页、官网博客等)区域中不同元素点击密度的图示。包括元素被点击的次数、占比、发生点击
的用户列表、按钮的当前与历史内容等因素。
大数据分析方法
分类
分类是一种基本的数据分析方式,数据根据其特点,可将数据对象划分为不同的部分和类型,再进一步分析,能够进一步挖掘事物的本质。
回归
回归是一种运用广泛的统计分析方法,可以通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各参数,然后评价回归模型是否能够很好的拟合实测数据,如果能够很好的拟合,则可以根据自变量作进一步预测。
聚类
聚类是根据数据的内在性质将数据分成一些聚合类,每一聚合类中的元素尽可能具有相同的特性,不同聚合类之间的特性差别尽可能大的一种分类方式,其与分类分析不同,所划分的类是未知的,因此,聚类分析也称为无指导或无监督的学习。
数据聚类是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。
相似匹配
相似匹配是通过一定的方法,来计算两个数据的相似程度,相似程度通常会用一个是百分比来衡量。相似匹配算法被用在很多不同的计算场景,如数据清洗、用户输入纠错、推荐统计、剽窃检测系统、自动评分系统、网页搜索和DNA序列匹配等领域。
频繁项集
频繁项集是指事例中频繁出现的项的集合,如啤酒和尿不湿,Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集,目前已被广泛的应用在商业、网络安全等领域。
统计描述
统计描述是根据数据的特点,用一定的统计指标和指标体系,表明数据所反馈的信息,是对数据分析的基础处理工作,主要方法包括:平均指标和变异指标的计算、资料分布形态的图形表现等。
链接预测
链接预测是一种预测数据之间本应存有的关系的一种方法,链接预测可分为基于节点属性的预测和基于网络结构的预测,基于节点之间属性的链接预测包括分析节点资审的属性和节点之间属性的关系等信息,利用节点信息知识集和节点相似度等方法得到节点之间隐藏的关系。与基于节点属性的链接预测相比,网络结构数据更容易获得。复杂网络领域一个主要的观点表明,网络中的个体的特质没有个体间的关系重要。因此基于网络结构的链接预测受到越来越多的关注。
数据压缩
数据压缩是指在不丢失有用信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。数据压缩分为有损压缩和无损压缩。
因果分析
因果分析法是利用事物发展变化的因果关系来进行预测的方法,运用因果分析法进行市场预测,主要是采用回归分析方法,除此之外,计算经济模型和投人产出分析等方法也较为常用。
统计分析方法
描述统计
描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。
1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。
2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。
假设检验
1、参数检验
参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验 。
1)U验 使用条件:当样本含量n较大时,样本值符合正态分布
2)T检验 使用条件:当样本含量n较小时,样本值符合正态分布
A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别;
B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似;
C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。
2、非参数检验
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。
适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。
A 虽然是连续数据,但总体分布形态未知或者非正态;
B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;
主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。
信度分析
检査测量的可信度,例如调查问卷的真实性。
分类:
1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度
2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。
列联表分析
用于分析离散变量或定型变量之间是否存在相关。
对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel分层分析。
列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验
相关分析
研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。
1、单相关: 两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量;
2、复相关 :三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关;
3、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。
方差分析
使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。
分类
1、单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系
2、多因素有交互方差分析:一顼实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系
3、多因素无交互方差分析:分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系
4、协方差分祈:传统的方差分析存在明显的弊端,无法控制分析中存在的某些随机因素,使之影响了分祈结果的准确度。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法
回归分析
分类:
1、一元线性回归分析:只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。
2、多元线性回归分析
使用条件:分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布 。
1)变呈筛选方式:选择最优回归方程的变里筛选法包括全横型法(CP法)、逐步回归法,向前引入法和向后剔除法
2)横型诊断方法:
A 残差检验: 观测值与估计值的差值要艰从正态分布
B 强影响点判断:寻找方式一般分为标准误差法、Mahalanobis距离法
C 共线性诊断:
诊断方式:容忍度、方差扩大因子法(又称膨胀系数VIF)、特征根判定法、条件指针CI、方差比例
处理方法:增加样本容量或选取另外的回归如主成分回归、岭回归等
3、Logistic回归分析
线性回归模型要求因变量是连续的正态分布变里,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况
分类:
Logistic回归模型有条件与非条件之分,条件Logistic回归模型和非条件Logistic回归模型的区别在于参数的估计是否用到了条件概率。
4、其他回归方法 非线性回归、有序回归、Probit回归、加权回归等
聚类分析
样本个体或指标变量按其具有的特性进行分类,寻找合理的度量事物相似性的统计量。
1、性质分类:
Q型聚类分析:对样本进行分类处理,又称样本聚类分祈 使用距离系数作为统计量衡量相似度,如欧式距离、极端距离、绝对距离等
R型聚类分析:对指标进行分类处理,又称指标聚类分析 使用相似系数作为统计量衡量相似度,相关系数、列联系数等
2、方法分类:
1)系统聚类法: 适用于小样本的样本聚类或指标聚类,一般用系统聚类法来聚类指标,又称分层聚类
2)逐步聚类法 :适用于大样本的样本聚类
3)其他聚类法 :两步聚类、K均值聚类等
判别分析
1、判别分析:根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体
2、与聚类分析区别
1)聚类分析可以对样本逬行分类,也可以对指标进行分类;而判别分析只能对样本
2)聚类分析事先不知道事物的类别,也不知道分几类;而判别分析必须事先知道事物的类别,也知道分几类
3)聚类分析不需要分类的历史资料,而直接对样本进行分类;而判别分析需要分类历史资料去建立判别函数,然后才能对样本进行分类
3、进行分类 :
1)Fisher判别分析法 :
以距离为判别准则来分类,即样本与哪个类的距离最短就分到哪一类, 适用于两类判别;
以概率为判别准则来分类,即样本属于哪一类的概率最大就分到哪一类,适用于
适用于多类判别。
2)BAYES判别分析法 :
BAYES判别分析法比FISHER判别分析法更加完善和先进,它不仅能解决多类判别分析,而且分析时考虑了数据的分布状态,所以一般较多使用;
主成分分析
将彼此梠关的一组指标变适转化为彼此独立的一组新的指标变量,并用其中较少的几个新指标变量就能综合反应原多个指标变量中所包含的主要信息
因子分析
一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法
与主成分分析比较:
相同:都能够起到済理多个原始变量内在结构关系的作用
不同:主成分分析重在综合原始变适的信息.而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法
用途:
1)减少分析变量个数
2)通过对变量间相关关系探测,将原始变量进行分类
时间序列分析
动态数据处理的统计方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题;时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动。
主要方法:移动平均滤波与指数平滑法、ARIMA横型、量ARIMA横型、ARIMAX模型、向呈自回归横型、ARCH族模型
生存分析
用来研究生存时间的分布规律以及生存时间和相关因索之间关系的一种统计分析方法
1、包含内容:
1)描述生存过程,即研究生存时间的分布规律
2)比较生存过程,即研究两组或多组生存时间的分布规律,并进行比较
3)分析危险因素,即研究危险因素对生存过程的影响
4)建立数学模型,即将生存时间与相关危险因素的依存关系用一个数学式子表示出来。
2、方法:
1)统计描述:包括求生存时间的分位数、中数生存期、平均数、生存函数的估计、判断生存时间的图示法,不对所分析的数据作出任何统计推断结论
2)非参数检验:检验分组变量各水平所对应的生存曲线是否一致,对生存时间的分布没有要求,并且检验危险因素对生存时间的影响。
A 乘积极限法(PL法)
B 寿命表法(LT法)
3)半参数横型回归分析:在特定的假设之下,建立生存时间随多个危险因素变化的回归方程,这种方法的代表是Cox比例风险回归分析法
4)参数模型回归分析:已知生存时间服从特定的参数横型时,拟合相应的参数模型,更准确地分析确定变量之间的变化规律
典型相关分析
相关分析一般分析两个变里之间的关系,而典型相关分析是分析两组变里(如3个学术能力指标与5个在校成绩表现指标)之间相关性的一种统计分析方法。
典型相关分析的基本思想和主成分分析的基本思想相似,它将一组变量与另一组变量之间单变量的多重线性相关性研究转化为对少数几对综合变量之间的简单线性相关性的研究,并且这少数几对变量所包含的线性相关性的信息几乎覆盖了原变量组所包含的全部相应信息。
R0C分析
R0C曲线是根据一系列不同的二分类方式(分界值或决定阈).以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线
用途:
1、R0C曲线能很容易地査出任意界限值时的对疾病的识别能力
用途 ;
2、选择最佳的诊断界限值。R0C曲线越靠近左上角,试验的准确性就越高;
3、两种或两种以上不同诊断试验对疾病识别能力的比较,一股用R0C曲线下面积反映诊断系统的准确性。
其他分析方法
多重响应分析、距离分祈、项目分祈、对应分祈、决策树分析、神经网络、系统方程、蒙特卡洛模拟等。
数据清洗
数据清洗是将重复、多余的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或者删除,最后整理成为我们可以进一步加工、使用的数据。
所谓的数据清洗,也就是ETL处理,包含抽取Extract、转换Transform、加载load这三大法宝。在大数据挖掘过程中,面对的至少是G级别的数据量,包括用户基本数据、行为数据、交易数据、资金流数据以及第三方的数据等等。选择正确的方式来清洗特征数据极为重要,除了让你能够事半功倍,还至少能够保证在方案上是可行的。
数据清洗的一般步骤:分析数据、缺失值处理、异常值处理、去重处理、噪音数据处理。在大数据生态圈,有很多来源的数据ETL工具,但是对于公司内部来说,稳定性、安全性和成本都是必须考虑的。
删除缺失值
当样本数很多的时候,并且出现缺失值的样本在整个的样本的比例相对较小,这种情况下,我们可以使用最简单有效的方法处理缺失值的情况。那就是将出现有缺失值的样本直接丢弃。这是一种很常用的策略。
均值填补法
根据缺失值的属性相关系数最大的那个属性把数据分成几个组,然后分别计算每个组的均值,把这些均值放入到缺失的数值里面就可以了
热卡填补法
对于一个包含缺失值的变量,热卡填充法的做法是:在数据库中找到一个与它最相似的对象,然后用这个相似对象的值来进行填充。不同的问题可能会选用不同的标准来对相似进行判定。最常见的是使用相关系数矩阵来确定哪个变量(如变量Y)与缺失值所在变量(如变量X)最相关。然后把所有变量按Y的取值大小进行排序。那么变量X的缺失值就可以用排在缺失值前的那个个案的数据来代替了。
还有类似于最近距离决定填补法、回归填补法、多重填补方法、K-最近邻法、有序最近邻法、基于贝叶斯的方法等。
异常值通常被称为“离群点”,对于异常值的处理,通常使用的方法有下面几种:
简单的统计分析
拿到数据后可以对数据进行一个简单的描述性统计分析,譬如最大最小值可以用来判断这个变量的取值是否超过了合理的范围,如客户的年龄为-20岁或200岁,显然是不合常理的,为异常值。
3∂原则
如果数据服从正态分布,在3∂原则下,异常值为一组测定值中与平均值的偏差超过3倍标准差的值。如果数据服从正态分布,距离平均值3∂之外的值出现的概率为P(|x-u| > 3∂) <= 0.003,属于极个别的小概率事件。如果数据不服从正态分布,也可以用远离平均值的多少倍标准差来描述。
箱型图分析
箱型图提供了识别异常值的一个标准:如果一个值小于QL01.5IQR或大于OU-1.5IQR的值,则被称为异常值。QL为下四分位数,表示全部观察值中有四分之一的数据取值比它小;QU为上四分位数,表示全部观察值中有四分之一的数据取值比它大;IQR为四分位数间距,是上四分位数QU与下四分位数QL的差值,包含了全部观察值的一半。箱型图判断异常值的方法以四分位数和四分位距为基础,四分位数具有鲁棒性:25%的数据可以变得任意远并且不会干扰四分位数,所以异常值不能对这个标准施加影响。因此箱型图识别异常值比较客观,在识别异常值时有一定的优越性。
基于模型检测
首先建立一个数据模型,异常是那些同模型不能完美拟合的对象;如果模型是簇的集合,则异常是不显著属于任何簇的对象;在使用回归模型时,异常是相对远离预测值的对象
优缺点:1.有坚实的统计学理论基础,当存在充分的数据和所用的检验类型的知识时,这些检验可能非常有效;2.对于多元数据,可用的选择少一些,并且对于高维数据,这些检测可能性很差。
基于距离
通常可以在对象之间定义邻近性度量,异常对象是那些远离其他对象的对象
优缺点:1.简单;2.缺点:基于邻近度的方法需要O(m2)时间,大数据集不适用;3.该方法对参数的选择也是敏感的;4.不能处理具有不同密度区域的数据集,因为它使用全局阈值,不能考虑这种密度的变化。
基于密度
当一个点的局部密度显著低于它的大部分近邻时才将其分类为离群点。适合非均匀分布的数据。
优缺点:1.给出了对象是离群点的定量度量,并且即使数据具有不同的区域也能够很好的处理;2.与基于距离的方法一样,这些方法必然具有O(m2)的时间复杂度。对于低维数据使用特定的数据结构可以达到O(mlogm);3.参数选择困难。虽然算法通过观察不同的k值,取得最大离群点得分来处理该问题,但是,仍然需要选择这些值的上下界。
基于聚类
基于聚类的离群点:一个对象是基于聚类的离群点,如果该对象不强属于任何簇。离群点对初始聚类的影响:如果通过聚类检测离群点,则由于离群点影响聚类,存在一个问题:结构是否有效。为了处理该问题,可以使用如下方法:对象聚类,删除离群点,对象再次聚类(这个不能保证产生最优结果)。
优缺点:1.基于线性和接近线性复杂度(k均值)的聚类技术来发现离群点可能是高度有效的;2.簇的定义通常是离群点的补,因此可能同时发现簇和离群点;3.产生的离群点集和它们的得分可能非常依赖所用的簇的个数和数据中离群点的存在性;4.聚类算法产生的簇的质量对该算法产生的离群点的质量影响非常大。
噪音,是被测量变量的随机误差或方差。对于噪音的处理,通常有下面的两种方法:
分箱法
分箱方法通过考察数据的“近邻”(即,周围的值)来光滑有序数据值。这些有序的值被分布到一些“桶”或箱中。由于分箱方法考察近邻的值,因此它进行局部光滑。
用箱均值光滑:箱中每一个值被箱中的平均值替换。
用箱中位数平滑:箱中的每一个值被箱中的中位数替换。
用箱边界平滑:箱中的最大和最小值同样被视为边界。箱中的每一个值被最近的边界值替换。
一般而言,宽度越大,光滑效果越明显。箱也可以是等宽的,其中每个箱值的区间范围是个常量。分箱也可以作为一种离散化技术使用.
回归法
可以用一个函数拟合数据来光滑数据。线性回归涉及找出拟合两个属性(或变量)的“最佳”直线,使得一个属性能够预测另一个。多线性回归是线性回归的扩展,它涉及多于两个属性,并且数据拟合到一个多维面。使用回归,找出适合数据的数学方程式,能够帮助消除噪声。