方差同质性检验的研究对象
我们经常遇到这样的一些问题:要判断不同的厂家生产的同一类产品的质量性能是否有本质的差异、来自不同地区的学员的某些素质是否存在显著的差异、不同方法培育的动植物间是否有明显的区别。这些不同的问题,当测定的指标值都来自正态总体时,可以用方差齐性检验和均值相等检验,但是对总体分布族信息掌握很少、分布不明确或数据是分组数据形式时(例如寿命试验中定周期测试数据、截尾寿命试验数据等),只能用非参数方法,即都可以归结成方差同质性检验。
设有m个总体,分别从中各取一个样本,第i个样本是
Xi1、Xi2…、Xini,1=l,2,…,m
其中ni是第i个样本量,n1+n2+…+nm=n。
如何检验这些样本之间的差异是由随机因素引起的,还是样本间有本质的差异?如果我们能检验这m个样本来自同一总体,那么它们之间的差异是由随机因素引起的;反之,则其间存在着本质的差异。(所以方差同质性检验P>0.05则认为没有显著性,不是随机因素引起的,是有本质差异的)
方差齐性检验与Fisher检验(数据是服从正态分布)
对要处理的数据是服从正态分布的情况下,我们可以充分利用正态性,简化检验的方法。设m个样本都来自正态总体,要检验这m个样本是否来自同一总体,或这m个样本间是否存在着本质的差异,那么我们既要检验这m个样本的方差是否存在着显著差异,又要检验其均值间是否存在着显著的差异。
先进行方差齐性检验。建立假设,当m个样本容量不全相等时,即n1、n2、…、nm不全相等,用Barlett检验法;
若n1=n2=…=nm=n0时,上述Barlett检验法仍然适用,但利用Hartley检验计算更简单 。
方差同质性检验(不了解数据分布)
如果我们对要处理的数据的分布了解甚少,或者数据是分组形式时,就需要有一种与总体分布的具体形式无关的非参数统计方法。方差同质性检验就是一种非参数方法。将m个样本混合为一个合样本:
(X11,X12,…X1ni,…Xm1,Xm2,…Xmmi)
其容量为n。试问。这m个样本是否来自同一总体,为此假设H0:m个样本来自同一总体。利用X2-检验法来研究在什么情况下应拒绝原假设H0。具体做法:
(1)把总体的取值范围分成l个不相交的子集:A1,A2,…,Ai
(2)记rij为第i个样本观察值落入Aj的个数,其中ni是第i个样本的容量,rj是m个样本落入Aj的频数。
(3)在假设H0为真的情况下,求出第i个样本落人Aj的理论频数。在H0为真的条件下,诸样本来自同一总体,Pi只与划分Aj有关,与所取样本无关,即不依赖于i=l,2,…,m。因为对总体分布没有作任何假定,所以用频率去估计概率Pj。
(4)考虑统计量。当n趋近于无穷时,X的极限分布为自由度f的X2分布。所以当n充分大时,可用X统计量作为方差同质性检验的统计量。统计量X的值愈大,说明实际频数rij与理论频数niPj的差愈大,m个样本来自同一总体的可能性愈大。
(5)参数估计:经方差同质性检验或方差齐性检验、均值相等检验没有显著差异的m个样本,我们可以视其为来自同一总体的一个合样本进行参数估计。
方差同质性检验对寿命试验分组数据的分析
当几个样本来自正态分布或可化为正态分布的总体时,要检验它们是否有本质差异。为了了解某9家漆包线厂产品耐热性的差异,将电缆所对的9家生产的漆包线所作的热老化试验数据,进行统计分析。
(1)寿命试验数据的分布
在高温下对9家生产的漆包线各取20个试样进行周期性老化试验,记录每周期内的失效数。根据国内外对绝缘热老化有关数据的统计分析,认为绝缘的热寿命T分布为对数正态分布。根据这一特征,要判断这9家漆包线的耐热性差异,先进行对数正态性检验,再采用方差齐性检验和Fisher检验。
(2)失效时间的估算
对绝缘结构进行的寿命试验是周期性的,只知受试样品在那个试验周期内失效,而不知具体失效时间,为此我们采用等分插值法估算失效样品的失效时间,即如果已知在第i个周期内有r个样品失效,则其中第i个样品的失效时间为tij。
(3)寿命数据的对数正态性的W检验法
(4)方差齐性检验
在对数正态分布的假设下,如果9个对数方差分之间及对数均值爪之间在统计上均没有显著差异,就可以认为这些生产厂家的产品寿命基本上是一致的.为此先作方差齐性检验。
(5)Fisher检验:对上述7个样本的对数均值作检验。
经上述检验,我们可以将1、2、5、…、9号样本与3、4号样本各作为一个合样本进行平均寿命的估计。分析绝缘结构平均寿命可知3、4号样本质量明显优于其它7家产品,而这7家产品的绝缘结构之间也相似,不存在显著差异 。