参见:https://www.iikx.com/news/statistics/1824.html
Permutation test具体怎么操作呢?以两样本数值变量比较为例,比如,有两组数据,第一组:40,45,55,57,58;第二组:55,57,62,64,65。
第一步:建立H0假设:两样本来自同一总体。
第二步:构造统计量,比如采用两组均数之差,第一组均数为51,第二组均数为60.6,两组均数差的绝对值为9.6(因默认双侧检验,所以这里用的绝对值)。
第三步:在H0假设的前提下,即两样本来自同一总体,对样本重新分组,也就是将上述10个数值随机分成两组,每组5个数值,每组重新分组时,均计算均数差。10个数随机等分为两组,共有252种情况,也就是说我们会得到252个均数差。
第四步:求出p=252个均数差中≥9.6的个数/252。
第五步:作出推断,如果p>0.05,说明在两样本来自同一总体的假设下,当前样本的出现是很平常的,不能拒绝H0假设,认为两样本的差异无统计学意义;如果p<0.05,则认为两样本的差异有统计学意义。
每组5个数值,一共两组,已经是很简单的情况了,竟也要252种情况,若是没有强大的计算机功能,还真的很难,也就是为什么之前Permutation test未能广泛推广的原因。