【2】一些指标的理解 - 方差同质性检验 Variance homogeneity test - 《YT库》

方差同质性检验的研究对象
方差齐性检验与Fisher检验（数据是服从正态分布）
方差同质性检验（不了解数据分布）
方差同质性检验对寿命试验分组数据的分析

方差同质性检验的研究对象

我们经常遇到这样的一些问题：要判断不同的厂家生产的同一类产品的质量性能是否有本质的差异、来自不同地区的学员的某些素质是否存在显著的差异、不同方法培育的动植物间是否有明显的区别。这些不同的问题，当测定的指标值都来自正态总体时，可以用方差齐性检验和均值相等检验，但是对总体分布族信息掌握很少、分布不明确或数据是分组数据形式时(例如寿命试验中定周期测试数据、截尾寿命试验数据等)，只能用非参数方法，即都可以归结成方差同质性检验。
设有m个总体，分别从中各取一个样本，第i个样本是
Xi1、Xi2…、Xini，1=l，2，…，m
其中ni是第i个样本量，n1+n2+…+nm=n。
如何检验这些样本之间的差异是由随机因素引起的，还是样本间有本质的差异?如果我们能检验这m个样本来自同一总体，那么它们之间的差异是由随机因素引起的；反之，则其间存在着本质的差异。（所以方差同质性检验P>0.05则认为没有显著性，不是随机因素引起的，是有本质差异的）

方差齐性检验与Fisher检验（数据是服从正态分布）

对要处理的数据是服从正态分布的情况下，我们可以充分利用正态性，简化检验的方法。设m个样本都来自正态总体，要检验这m个样本是否来自同一总体，或这m个样本间是否存在着本质的差异，那么我们既要检验这m个样本的方差是否存在着显著差异，又要检验其均值间是否存在着显著的差异。
先进行方差齐性检验。建立假设，当m个样本容量不全相等时，即n1、n2、…、nm不全相等，用Barlett检验法；
若n1=n2=…=nm=n0时，上述Barlett检验法仍然适用，但利用Hartley检验计算更简单。

方差同质性检验（不了解数据分布）

如果我们对要处理的数据的分布了解甚少，或者数据是分组形式时，就需要有一种与总体分布的具体形式无关的非参数统计方法。方差同质性检验就是一种非参数方法。将m个样本混合为一个合样本：
(X11，X12，…X1ni，…Xm1，Xm2，…Xmmi)
其容量为n。试问。这m个样本是否来自同一总体，为此假设H0：m个样本来自同一总体。利用X2-检验法来研究在什么情况下应拒绝原假设H0。具体做法：
（1）把总体的取值范围分成l个不相交的子集：A1，A2，…，Ai
（2）记rij为第i个样本观察值落入Aj的个数，其中ni是第i个样本的容量，rj是m个样本落入Aj的频数。
（3）在假设H0为真的情况下，求出第i个样本落人Aj的理论频数。在H0为真的条件下，诸样本来自同一总体，Pi只与划分Aj有关，与所取样本无关，即不依赖于i=l，2，…，m。因为对总体分布没有作任何假定，所以用频率去估计概率Pj。
（4）考虑统计量。当n趋近于无穷时，X的极限分布为自由度f的X2分布。所以当n充分大时，可用X统计量作为方差同质性检验的统计量。统计量X的值愈大，说明实际频数rij与理论频数niPj的差愈大，m个样本来自同一总体的可能性愈大。
（5）参数估计：经方差同质性检验或方差齐性检验、均值相等检验没有显著差异的m个样本，我们可以视其为来自同一总体的一个合样本进行参数估计。

方差同质性检验对寿命试验分组数据的分析

当几个样本来自正态分布或可化为正态分布的总体时，要检验它们是否有本质差异。为了了解某9家漆包线厂产品耐热性的差异，将电缆所对的9家生产的漆包线所作的热老化试验数据，进行统计分析。
（1）寿命试验数据的分布
在高温下对9家生产的漆包线各取20个试样进行周期性老化试验，记录每周期内的失效数。根据国内外对绝缘热老化有关数据的统计分析，认为绝缘的热寿命T分布为对数正态分布。根据这一特征，要判断这9家漆包线的耐热性差异，先进行对数正态性检验，再采用方差齐性检验和Fisher检验。
（2）失效时间的估算
对绝缘结构进行的寿命试验是周期性的，只知受试样品在那个试验周期内失效，而不知具体失效时间，为此我们采用等分插值法估算失效样品的失效时间，即如果已知在第i个周期内有r个样品失效，则其中第i个样品的失效时间为tij。
（3）寿命数据的对数正态性的W检验法
（4）方差齐性检验
在对数正态分布的假设下，如果9个对数方差分之间及对数均值爪之间在统计上均没有显著差异，就可以认为这些生产厂家的产品寿命基本上是一致的.为此先作方差齐性检验。
（5）Fisher检验：对上述7个样本的对数均值作检验。
经上述检验，我们可以将1、2、5、…、9号样本与3、4号样本各作为一个合样本进行平均寿命的估计。分析绝缘结构平均寿命可知3、4号样本质量明显优于其它7家产品，而这7家产品的绝缘结构之间也相似，不存在显著差异。