参数估计是推断统计的重要内容之一。它是在抽样及抽样分布的基础上,根据样本统计量来推断所关心的总体参数。
参数估计的基本原理
估计量与估计值
参数估计就是用样本统计量去估计总体的参数。
在参数估计中,用来估计总体参数的统计量称为估计量,样本均值、样本比例、样本方差等都可以是一个估计量。根据一个具体的样本计算出来的估计量的数值称为估计值。
点估计与区间估计
参数估计的方法有点估计和区间估计两种
- 点估计
点估计就是用样本统计量的某个取值直接作为总体参数的估计值。 - 区间估计
区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计参数得到。
在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数直值的次数所占的比例称为置信水平,也称为置信度或置信系数。
评价估计量的标准
参数估计是用样本估计量作为总体参数 的估计。
- 无偏性
无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。 - 有效性
一个无偏对估计量并不意味着它就是非常接近被估计对参数,它还必须与总体参数对离散程度比较小。有效性是指对同一总体参数的两个无偏估计量,由更小标准差的估计量更有效。 - 一致性
一致性是指随着样本量的增大,估计量的值越来越接近被估计总体的参数。
一个总体参数的区间估计
当总体服从正态分布且已知时,或者总体不是正态分布但为大样本时,样本均值的抽样分布均为正态分布,其数学期望为总体均值,方差为。而样本均值经过标准化以后的随机变量服从标准正态分布,即
%0A#card=math&code=z%3D%5Cfrac%7B%5Coverline%7Bx%7D-%5Cmu%7D%7B%5Csigma%2F%5Csqrt%7Bn%7D%7D%EF%BD%9EN%280%2C1%29%0A)
如果总体服从正态分布,则无论样本量如何,样本均值的抽样分布都服从正态分布。这时,只要总体方差已知,即使是指小样本的情况下,也可以按照上述公式建立总体均值的置信区间。但是,如果总体方差未知,而且是指小样本情况下,则需要用样本方差代替,这时,样本均值经过标准化以后的随机变量服从自由度为(n-1)的t分布,即
%0A#card=math&code=t%3D%5Cfrac%7B%5Coverline%7Bx%7D-%5Cmu%7D%7Bs%2F%5Csqrt%7Bn%7D%7D%EF%BD%9Et%28n-1%29%0A)
总结
一个总体参数的区间估计
参数 | 点估计量(值) | 标准误差 | %25#card=math&code=%281-%5Calpha%29%25)的置信区间 | 假定条件 |
---|---|---|---|---|
总体均值 | (1) 已知 (2)大样本() |
|||
总体均值 | (1)未知 (2)大样本() |
|||
总体均值 | (1)正态总体 (2)未知 (3)小样本() |
|||
总体比例 | %7D%7Bn%7D%7D#card=math&code=%5Csqrt%7B%5Cfrac%7B%5Cpi%281-%5Cpi%29%7D%7Bn%7D%7D) | %7D%7Bn%7D%7D#card=math&code=p%5Cpm%20z_%7B%5Calpha%2F2%7D%5Csqrt%7B%5Cfrac%7Bp%281-p%29%7D%7Bn%7D%7D) | (1)二项总体 (2)大样本%20%5Cgeq%205)#card=math&code=%28np%20%5Cgeq%205%2Cn%281-p%29%20%5Cgeq%205%29) |
|
总体方差 | (不要求) | s%5E2%7D%7B%5Cchi%7B%5Calpha%2F2%7D%5E2%7D%5Cleq%5Csigma%5E2%5Cleq%5Cfrac%7B(n-1)s%5E2%7D%7B%5Cchi%7B1-%5Calpha%2F2%7D%5E2%7D#card=math&code=%5Cfrac%7B%28n-1%29s%5E2%7D%7B%5Cchi%7B%5Calpha%2F2%7D%5E2%7D%5Cleq%5Csigma%5E2%5Cleq%5Cfrac%7B%28n-1%29s%5E2%7D%7B%5Cchi%7B1-%5Calpha%2F2%7D%5E2%7D) | 整态总体 |