参数检验
参数检验(parameter test)全称参数假设检验,是指对参数平均值、方差进行的统计检验。参数检验是推断统计的重要组成部分。当总体分布已知(如总体为正态分布),根据样本数据对总体分布的统计参数进行推断。
先由测得的样本数据计算检验统计量,若计算的统计量值落入约定显著性水平a 时的拒绝域内,说明被检参数之间在所约定的显著性水平a 下在统计上有显著性差异;反之, 若计算的统计量值落入约定显著性水平a 时的接受域内,说明被检参数之间在统计上没有显著性差异,是同一总体的参数估计值。
t检验目的
在样本中比较连续变量的平均数,以检验均值之间的差异是否大于能被所解释的差异。
样本均值有差异,总体之间确实存在差异的概率是多少?
t检验适用于小样本分布(普遍服从t分布 样本数小于50) 大样本采用z检验。
单样本t检验
某个连续变量的样本均值与给定的总体的已知均数相比,其差异是否有显著。
举例:
- 周岁儿童的平均身高是否为75厘米。
- 居民平均存(取)款金额是否为2000元。
- 某工厂用自动打包机打包,每包标准质量为10Okg为了保证生产的正常运行,每天开工后需要先行试机,检查打包机是否有系统偏差,以及时进行调整。某日开工后在试机中共打了9个包,测得9包的质(kg)为:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5现希望作出判断,明确打包机是否需要进行调整
数据要求:小样本时来自的总体服从正态分布,如果大样本或者是数据收集的时候没有特殊性,可以忽略正态分布的假设。
单样本均值检验过程
提出H0假设
基础统计学知识
在假设检验中,首先需要提出两种假设,即原假设(H0)和备择假设(H1):
•H0:通常是研究者想收集证据予以反对的一方,也称零假设;
•H1:通常是研究者收集证据予以支持的一方,也称对立假设
在这里教大家如何去确定原假设和备择假设:
- 在假设检验中,等号“=”总是放在原假设H0;
- 原假设和备择假设是一对相互对立的事件;
- 在建立建设检验时,通常先确定备择假设,再确立原假设;
- 一般来说,把期望证明成立的一方放在备择假设中。
单样本均值检验过程:
1、提出H0假设。
设总体均值与检验值之间不存在显著差异(样本均值所引起的差异是抽样误差引起的)
2、选择
假设总体服从正态分布,方差已知时-构造Z统计量;方差未知时-构造 t 统计量。
3、给出显著性水平,做出决策。
假设检验结论:
P<0.5 研究假设成立
P>0.5研究假设不成立.
spss
用到的变量:一个连续变量。
独立样本均值t检验
用来检验两组独立样本在某个连续变量的均值是否有显著差异。
原假设:两组独立样本来自的总体在该变量的均值上没有显著差异
研究假设:两组独立样本来自的总体在该变量的均值上有显著差异
根据两个独立样本的数据,对两总体均值是否有显著差异进行推断。
数据要求:样本来自的总体服从正态分布。
两样本必须相互独立,即:抽泣其中一批样本对抽取另一批样本没有任何影响,两组样本的个案数可以不相等
要求两样本是大样本,小样本则必须来自正态总体
spss
独立样本均值t检验过程
提出原假设:两样本的总体均值没有显著差异
进行方差齐性检验:在两样本的总体均值方差未知的情况下计算t值。
根据t值对应的P值得出结论。
原假设:两组来自总体的变量数据在分布上没有差异,即两组数据在该变量的取值上没有显著差异。
研究假设:两组来自总体的变量数据在分布上有差异,即两组数据在该变量的取值上有显著差异。
方差齐性检验
h0:两组总体中的方差是相等的。
h1:两组总体中的方差是不相等的。
当p<0.05,研究假设成立,即h1,需要看第二行t值检验结果,反之看第一行t值结果。
用来检验不同组的总体方差是否相等。
在一些统计推断的过程,要求进行比较的两组或多组数据的方差相等,即要求方差齐性,如均值比较,方差分析。
配对样本t检验
对同一样本进行两次此时所获得的两组数据,或对两个完全相同的样本在不同条件下进行测试所获得的两组数据。
例:某种减肥茶是否有效
数据要求:
两样本数据必须两两配对,即:样本个数相同,个案顺序相同,如减肥茶效果,不同广告形式对销售额的影响。
两总体服从正态分布(小样本情况下)样本容量>30的情况下,且数据收集是随机的,可以认为服从正态分布。
思路:先求出没对观测值的差,再将差值与总体均数0比较的t检验。
原假设:来自总体的同一组人群的两组数据在分布上没有差异,即两组数据在该变量的取值上没有显著差异。
研究假设:来自总体的同一组人群的两组数据在分布上有差异,即两组数据在该变量的取值上有显著差异。
F检验/方差检验/ANOVA
概念:对三个以上的组之间的平均值的差进行比较,从统计学意义上判断是否有显著差异,用来揭示作用于一个因变量的几个分类自变量(因素)的主效应和交互效应。
两个前提:
- 变量各总体服从正态分布(数据进行方差检验钱需检验分布情况)
- 变量各总体方差相同(数据进行方差经验钱需做方差齐性检验)
通常是针对自变量是分类变量,因变量是连续变量进行的检验。
原理:
- 计算组内、组间、随机因素的数据差异程度。
- 计算组内数据差异程度占观测变量(因变量)数据总差异的比例,与组内差异、随机因素的差异占比之间的大小关系。
SST=SSA+SSE
SST:观测变量总离差平方和
SSA:组间变量总离差平方和
SSE:组内变量总离差平方和
变量
自变量既可以是分类也可以是连续变量,因变量必须是连续变量。
单因素方差检验
一个或多个因变量,自变量只有一个(分类变量);检验一个因变量在一个分类自变量两组、三组或多组类别间的差异。
变量:因变量是一个且为连续,自变量是一个为分类变量。
检验3组及以上人群在某个连续变量均值上是否存在差异,或某个分类变量对某个连续变量是否存在显著差异。
h0:自变量与因变量之间不存在显著相关;不同人群之间在该连续变量的均值上没有显著差异。
h1:自变量与因变量之间存在显著相关;不同人群之间在该连续变量的均值有显著差异。
多因素方差检验
一个因变量,多个自变量;分析一个因变量在两个或多个自变量所形成的组间的差异,其中一个自变量可看做处理变量。
检验多个变量在某个连续变量均值上是否存在差异,或多个变量对某个连续变量是否存在显著相关。
变量:因变量是一个且为连续,自变量是多个既可以分类变量也可以连续变量。
重复方差检验
方差检验专业术语
因素(Factor)
因素是可能对因变量有影响的变量,一般来说,因素会有不止一个水平,而分析的目的 就是考察或比较各个水平对因变量的影响是否相同。
水平(Level)
因素的不同取值等级称作水平,例如性别有男、女两个水平。
单元(Cell)
单元亦称试验单位(Experimental Unit),指各因素的水平之间的每种组合。指各因素各个水平的组合,例如在研究性别(二水平)、血型(四水平)对成年人身高的影响时 ,该设计最多可以有2*4=8个单元。注意在一些特殊的试验设计中,可能有的单元在样本中并不会出现,如正交设计。
元素(Element)
指用于测量因变量值的观察单位,比如研究职业与收入间的关系,月收入是从每一位受访者处得到,则每位受访者就是试验的元素 。
一个单元格内可以有多个元素,也可以只有一个,甚至没有元素。
注意:元素不一定就等同于受访者个体!
- 重复测量数据
- 以家庭为单位收集资料
均衡(Balance)
如果在一个实验设计中任一因素各水平在所有单元格中出现的次数相同,且每个单元格内的元素数均相同,则该试验是均衡的,否则,就被称为不均衡。不均衡的实验设计在分析时较为复杂,需要对方差分析模型作特别设置才能得到正确的分析结果。
协变量(Covariates)
指对因变量可能有影响,需要在分析时对其作用加以控制的连续性变量,实际上,可以简单的把因素和协变量分别理解为分类自变量和连续性自变量。当模型中存在协变量时 ,一般是通过找出它与因变量的回归关系来控制其影响。
交互作用(Interaction)
如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须分另一个因素的不同水平研究该因素的作用大小。
如果所有单元格内都至多只有一个元素,则交互作用无法进行分析,只能不予考虑。
固定因素(Fixed Factor)
指的是该因素在样本中所有可能的水平都出现了。从样本的分析结果中就可以得知所有水平的状况,无需进行外推。 绝大多数情况下,研究者所真正关心的因素都是固定因素。
性别:只有两种
疗法:只有三种
随机因素(Random Factor)
该因素所有可能的取值在样本中没有都出现,目前在样本中的这些水平是从总体中随机抽样而来,如果我们重复该研究,则可能得到的因素水平会和现在完全不同!
这时,研究者显然希望得到的是一个能够“泛化”,即对所有可能出现的水平均适用的结果。这不可避免的存在误差,需要估计误差的大小,因此被称为随机因素。
方差检验总结
方差分析是从数据间的差异入手,分析哪些因素是影响数据差异的众多因素中的主要因素,用以解决多总体均值的比较问题 。
方差分析核心问题,从数据差异角度看
观测变量的数据差异=控制因素引起的差异+随机因素造成的差异
方差分析正是要分析响应变量的变动是否主要是由控制因素的造成的,还是由随机因素造成的,以及控制因素的各个水平是是如何对响应变量影响的
前提:假定在控制因素的不同水平下总体服从方差相等的正态分布(需要进行方差齐性检验)
检验控制因素(自变量)的不同水平下,各总体的分布是否存在显著差异,进而判断控制因素是否对响应变量产生了显著影响
H0: 在控制因素的不同水平下,各总体均值无显著差异,即不同水平下的控制因素的影响不显著
SPSS
操作路径:分析-比较平均值-单因素ANOVA
- 两两比较中根据方差齐性检验结果,来选择方差相等的比较结果或方差不等的检验结果。
- 方差齐性检验:选项—方差齐性检验。当方差不齐时,则通过非参数检验中的K个独立样本检验法进行检验。
全因子模型:既考虑所有自变量对于因变量直接效应,又考虑所有分类变量的交互作用对因变量的影响。
定制模型:可根据研究者自身需求定制需要考虑的对因变量的影响因素,比如只考虑自变量的直接效应,或部分自变量的交互作用。
当自变量特别多的时候,尤其是分类自变量特别多时,且样本量不多时,应该使用定制模型。