检验目的:比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。
适用条件:变量均为分类变量
检验思路:
H0:两个变量之间彼此独立
作出两个变量的联列表。在H0成立的条件下,每格的理论值应与总数是成比例的,且实际值与理论值的差异程度是小的。如果差异程度过大,那么可以认为原假设不成立,两个变量之间不是彼此独立的。
检验统计量为
A为实际值,T为理论值
原假设成立的条件下,该统计量服从自由度为(行数-1)*(列数-1)的卡方分布
代码示例:
data1 <- data.frame('药物'=sample(c('A','B'),size = 50,replace = T,prob = c(0.7,0.3)),
'是否有效'=sample(c('有效','无效'),size = 50,replace = T,prob = c(0.6,0.4)))
#用哪种药物和是否有效的联列表
as.matrix(table(data1))
#卡方检验
chisq.test(as.matrix(table(data1)))