名词解释:
定类(nominal)
定序(ordinal)
定距(scale)
定比(scale)
比例分布检验
检验一个变量中取值的比例是否均匀,或者是否符合设定比例分布。
原假设:变量的取值分布与均匀分布(或研究者设定的分布)没有显著差异。
研究假设:变量的取值分布与均匀分布(或研究者设定的分布)有显著差异。
二项式检验
检验一个变量取二分类两个值的概率是否符合设定的概率。
原假设:变量的第一个取值比例与设定比例没有显著差异。
研究假设:变量的第一个取值比例与设定比例有显著差异。
操作路径:分析-非参数检验-旧对话框-二项式
分割点:将一个连续变量,选择一个值分割为大于该值和小于该值
K-S检验
检验样本来自的总体中,一个变量的分布是否服从正太分布,均匀分布,泊松分布,指数分布。
原假设:变量来自的总体分布与正态分布等没有显著差异,即变量在同体中呈现正态分布等。
研究假设:变量来自的总体分布与正态分布等有显著差异,即变量在同体中不呈现正态分布等。
游程检验
检验一个变量的两个取值出现顺序是否随机。两个值出现比例各占50%。
检验场景:通常是检验随着时间变化而产生的两个数值的出现顺序是否随机。
原假设:变量两个值出现顺序和随机出现没有差异,即变量两个值出现是随机的。
研究假设:变量两个值出现顺序不是随机的。
交叉分析
主要用在两个分类变量(定类\定序)之间的相关性检验。
例如:考察不同性别的受访者购买牛奶的主要场所是否存在差异。
如果场景中需要对连续变量进行卡方检验,首先需要将连续变量转换为分类变量,如年龄分成70后、80后、90后、00后。
操作路径:分析-描述性统计-交叉表
连续变量转换为分类变量-转换-重新编码为不同变量。
如果两个变量都是定类变量,相关系数可使用卡方检验中”名义”里的四个相关系数。如果两个都是定序变量,则选择”有序”里的四个相关系数。
卡方检验解读:
- 看卡方检验结果根据P值判断两个变量之间的相关性,如果判断为无相关那么其他表格都没有意义,即不用再看。
- 看相关系数判断两者之间相关性到底有多大。
- 0-0.2较弱相关;
- 0.2-0.2弱相关;
- 0.4-0.6相关性一般;
- 0.6-0.8较强相关;
- 0.8-1强相关。
- 看频次分布、具体分析两者存在什么样的相关。
如果两个变量中一个为分类一个为定序相关系数应该选用’’名义’’,因为定序可降级为定类,而定类不可升为定序。