检验目的:比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。
    适用条件:变量均为分类变量
    检验思路:
    H0:两个变量之间彼此独立
    作出两个变量的联列表。在H0成立的条件下,每格的理论值应与总数是成比例的,且实际值与理论值的差异程度是小的。如果差异程度过大,那么可以认为原假设不成立,两个变量之间不是彼此独立的。
    检验统计量为
    image.png A为实际值,T为理论值
    原假设成立的条件下,该统计量服从自由度为(行数-1)*(列数-1)的卡方分布
    代码示例:

    1. data1 <- data.frame('药物'=sample(c('A','B'),size = 50,replace = T,prob = c(0.7,0.3)),
    2. '是否有效'=sample(c('有效','无效'),size = 50,replace = T,prob = c(0.6,0.4)))
    3. #用哪种药物和是否有效的联列表
    4. as.matrix(table(data1))
    5. #卡方检验
    6. chisq.test(as.matrix(table(data1)))