分析方法选择 | |||
---|---|---|---|
建议:先描述想研究什么,用一句话描述,话里面拆开成X和Y:然后结合X与Y的数据类型,选择对应的分析方法。 | |||
分析方法 | 功能介绍 | 一句话说明 | 数据类型 |
频数 | 百分比 | 男女比例分别多少 | 定类 |
交叉(卡方) | 差异关系 | 不同性别【 X 】人群是否抽烟【 Y 】的差异情况 | X(定类) Y(定类) |
描述 | 平均值 | 平均身高,量表数据平均得分等 | 定量 |
分类汇总 | 差异关系 | 不同城市的销售额情况 | X(定类)【 可选 】 Y(定量/定类) |
相关 | 相关关系 | 身高【 X 】和体重【 Y 】有没有关系 | X(定量)【 可选 】 Y(定量)【 可选 】 |
回归 | 影响关系 | 身高【 X 】影响体重【 Y 】吗? | Y(定量) X(定量/定类) |
聚类 | 人群分类 | 300个人分成几类? | 定量 |
因子 | 浓缩 权重 |
30句话概述成5个关键词(因子) 5个关键词(因子)分别代表30句话的信息比重? |
定量 |
主成分 | 浓缩 权重 |
30句话概述成5个关键词(成分) 5个关键词(主成分)分别代表30句话的信息比重? |
定量 |
信度 | 可靠性 | 数据真实吗? | 定量 |
效度 | 有效性 | 数据有效吗? | 定量 |
项目分析 | 区分度 | 设计的量表题目是否有区分度? | 定量(量表题) |
熵值法 | 权重 | 研究项的权重比例如何? | 定量 |
方差 | 差异关系 | 不同收入【 X 】群体的身高【 Y 】是否有差异? | X(定类) Y(定量) |
T检验 | 差异关系 | 不同性别【 X 】群体的身高【 Y 】是否有差异?【 X 仅2个类别比如男和女】 | X(定类) Y(定量) |
多重响应 | 百分比 | 多选题的选择比例情况如何 | X(定类)【 可选 】 多选题选项 |
事后多重比较 | 差异关系 | 不同收入【 X 】群体的身高【 Y 】详细差异情况?【 X 两两组别之间差异对比】 | X(定类) Y(定量) |
单样本T检验 | 差异关系 | 身高是否明显等于1.8 | 定量 |
配对T检验 | 差异关系 | 注射新药和没有注射的两组老鼠,血压一样吗? | 配对1(定量) 配对1(定量) |
逐步回归 | 影响关系 | 帮我自动找出影响身高 Y的因素 X | Y(定量) X(定量/定类) |
分层回归 | 影响关系 | 身高【 X,分层1】对于体重【 Y】的影响,再加入饮食习惯【 X,分层2】,看看饮食习惯对体重的影响有多严重 | Y(定量) 分层1(定量/定类) 分层2(定量/定类) 分层3(定量/定类) 分层4(定量/定类) |
正态性检验 | 正态检验 | 数据正态吗? | 定量 |
非参数检验 | 差异关系 | 身高数据不正态时,我想研究收入【 X 】与身高【 Y 】的差异关系 | Y(定类) X(定量) |
双因素方差 | 差异关系 | 性别【 X 】和地区【 X 】对于身高【 Y 】的差异 | Y(定量) X(定类,2个) |
二元Logit | 影响关系 | 哪些因素【 X 】影响人们是否购买电影票【Y 】 | Y(定类,2项) X(定量/定类) |
多分类Logit | 影响关系 | 哪些因素【 X 】影响人们购买不同类型电影票【 Y 】 | Y(定类,2+项) X(定量/定类) |
散点图 | 数据关系 | 身高【 X 】和体重【 Y 】的关系情况,并且区分性别【颜色区分】 | Y(定量) X(定量) 颜色区分(定类) |
正态图 | 正态性 | 身高数据是否正态分布 | X(定量) |
箱线图 | 数据分布 | 身高数据的分布情况 | X(定量) |
词云图 | 数据展示 | 热点城市房价指数展示 | X(定量) 加权项(可选) |