前言:每种检验都有一定的适用范围,本文简单归纳Z检验、T检验、F检验、卡方检验这几种检验方法对样本的要求。
一、非连续性资料的检验(离散型资料)
卡方检验常用于非连续性资料的检验,其特点如下:
(1)一般样本比较小,只数个数,是整数的,比如不存在0.5个;
(2)卡方检验有时也可以用于连续性资料的卡方分布的适应性检验,不过要对资料稍作处理,将资料划分为不同的区间,其实也相当于把连续性的资料变成非连续性的了,所以归纳为卡方检验用于非连续性资料的检验。
二、连续性资料的检验
(Z检验,t检验,F检验都是用于连续性资料的检验)
根据群总体个数根据群总体个数不同,区分如下:
(一)单个总体或两个总体
1. Z检验
Z检验仅仅用于总体的标准差已知的检验。
2. t检验
用于总体的标准差未知。
总结:t检验和z检验的差别就是在总体的标准差是已知还是未知这里。
(二)3个或3个以上的总体
F**检验,常常与方差分析绑定在一起,方差分析的基本步骤为:(1)假设,(2)平方和的计算,(3)列方差分析表,(4)由F值判断F值是落在否定域还是接受域,(5)下结论。
(1)比如研究4**种饲料对仔猪增重效果的优劣,群总体为分别喂4种不同饲料的总体,4个样本是从这4个总体里面抽取出来的,如教材P83例6.1(方差分析I-单向分类资料)。
(2)除此之外,教材P102例7.1(方差分析II-双向交叉分组无重复资料),教材P107例7.2(方差分析II-双向交叉分组有重复资料),我们可以看到,在双向交叉分组资料里,因子A或因子B对应的群总体个数都是大于或等于3个的。
———————————————————————————————————————————————————
补充:
标准正态分布几个特殊且常用的分位数值:
当双尾概率为0.05(即每侧为0.025)时,u=1.96
当双尾概率为0.01(即每侧为0.005)时,u=2.58
当右尾概率(左尾概率)为0.05时,u=1.64(-1.64)
当右尾概率(左尾概率)为0.01时,u=2.33(-2.33)
我们由**F分布的图像可知,F**分布只有右尾概率。
————————————————————————————————————————————————————
三.例题举例
例**1**.(单因素方差分析) 某实验室欲研究A、B、C三种降血脂药物对猪血脂的影响。将12头同等条件的猪随机分为三组,均喂以相同的高脂饲料,一段时间后测定血清中血脂浓度(u/ml),结果见下表,问三种药物降血脂的效果是否存在显著差异?(α=0.05)∑∑x=1222,F(2,9)=4.26)
处理 | 血脂浓度(u/ml) | 合计 |
---|---|---|
实验组A | 12,8,10,10 | 40 |
实验组B | 10,10,12,9 | 41 |
实验组C | 10,9,8,12 | 39 |
总计 | x…=120 |
例**1.**步骤及答案
建立检验假设:
H:三个实验组的血脂浓度总体均数相等,即μ1=μ2=μ3=μ4。
计算统计量:
1.校正项CT=x../N=120/12=1200;
2.总平方和SST=∑∑x2-CT=1222-1200=22;
3.处理平方和SSA=(1/n)∑∑x.2-CT=(1/4)(402+412+392)-1200=1200.5-1200=0.5
4.误差平方和SSE=SST-SSA=22-0.5=21.5
5.总自由度dfT=N-1=12-1=11
6.处理自由度dfA=3-1=2
7.误差自由度dfE=11-2=9
例**2**.某农场为了研究体重与体长的关系,测得5头杜洛克猪的数据如下:
试建立体长对体重的回归方程。( mean(x)=36.6, mean(y)=85.8,∑x=183,∑y=429,∑x=6785,∑y=37013,∑xy=15820)
体重x(kg) | 30 | 35 | 40 | 36 | 42 |
---|---|---|---|---|---|
体长y(cm) | 80 | 82 | 92 | 80 | 95 |
例**2.**步骤及答案:
(1)计算统计量:
SS=∑x-(∑x)/n=6785-183/5=87.2
SS=∑y-(∑y)/n=37013-429/5=204.8
SP=∑xy-∑x∑y/n=15820-183429/5=118.6
2)估计回归参数:
b=SP/SS=118.6/87.2=1.36
a=mean(y)-bmean(x)=85.8-1.36*36.6=36
(3)建立回归方程:
y^=36+1.36x