假设检验是一种统计推断方法,用来判断样本与样本、样本与总体的差异是由抽样误差引起的还是本质差别造成的。常用的假设检验方法有T检验、Z检验、F检验、卡方检验等。Stata中用到假设检验的地方很多,基本上都是对估计参数的显著性检验,不论是什么类型的假设检验,基本原理都是先对总体的特征做出某种假设,然后构建检验统计量,并将检验统计量与临界值相比较,最后做出是否接受原假设的结论。
假设检验的基本思想是“小概率事件”原理,即小概率事件在一次试验中基本上不会发生,其统计推断方法是带有某种概率性质的反证法,也就是说先提出检验的原假设和备择假设,再用适当的统计方法,利用小概率原理确定原假设是否成立。简单来说,就是提出原假设后,首先假定原假设是可以接受的,然后依据样本观测值进行相应的检验,如果检验中发现“小概率事件”发生了,也就是说基本不可能发生的事件发生了,就说明原假设是不可接受的,应拒绝原假设,接受备择假设。如果检验中小概率事件没有发生,就接受原假设。
上面所提到的“小概率事件”是基于人们在实践中广泛采用的原则,但概率小到什么程度才能算作“小概率事件”?一个显而易见的事实就是“小概率事件”的概率越小,否定原假设就越有说服力,通常情况下将这个概率值记为α(0<α<1),称为检验的显著性水平;将基于样本观测值实际计算的容忍小概率事件发生的概率值记为p(0<p<1),称为检验的显著性p值,如果p值大于α值,则说明实际可以容忍的小概率事件发生的概率要大于设定的α值,也就是要接受原假设。常用的显著性水平包括0.1、0.05、0.01等,其中0.05最为常用。
假设检验的步骤如下:
(1)提出原假设(H0)和备择假设(H1)。原假设的含义一般是样本与总体或样本与样本间的差异是由抽样误差引起的,不存在本质差异;备择假设的含义一般是样本与总体或样本与样本间存在本质差异,而不是由抽样误差引起的。
(2)设定显著性水平α。
(3)构建合适的统计量,然后基于样本观测值按相应的公式计算出统计量的大小,如T检验、Z检验、F检验、卡方检验等。
(4)根据统计量的大小计算显著性p值,将p值与显著性水平α作比较,如果p值大于α值,则说明实际可以容忍的小概率事件发生的概率要大于设定的α值,也就是要接受原假设;如果p值小于α值,则拒绝原假设。
假设检验有以下注意事项:
在对变量开展假设检验之前,应该先判断样本观测值本身是否有可比性 ,并且注意每种检验方法的适用条件,根据资料类型和特点选用正确的假设检验方法,根据专业及经验确定是选用单侧检验还是双侧检验。在假设检验结束之后,对结果的运用也不要绝对化,一是假设检验反映的差别仅仅是具备统计学意义,而这样的差别在实际应用中可能没有意义;二是由于样本的随机性及选择显著性水平α的不同,基于某次抽样或者特定范围内的样本观测值得出的检验结果与真实情况有可能不吻合,所以无论接受或拒绝检验假设,都有判断错误的可能性 。
假设检验可能犯的错误有两类:
一类是拒绝为真的错误。即使原假设正确,小概率事件也有可能发生,如果我们抽取的样本观测值恰好是符合小概率事件的样本观测值,就会因为小概率事件的发生而拒绝原假设,这类错误被称为“拒绝为真”错误,也被称为第一类错误,犯第一类错误的概率恰好就是“小概率事件”发生的概率α。
另一类是接受伪值的错误。如果原假设是不正确的,暗示我们由于抽样的不合理,导致假设检验通过了原假设,这类错误被称为“接受伪值”错误,也被称为第二类错误,我们把犯第二类错误的概率记为β。
对于研究人员来说,无论是哪种错误,都是不希望出现的,但是当样本容量固定时,第一类错误发生的概率α和第二类错误发生的概率β不可能同时变小,换言之,当我们倾向于使得α变小时,β就会变大;同样的道理,倾向于使得β变小时,α就会变大。只有当样本容量增大时,能够更好地满足大样本随机原则时,才有可能使得α和β同时变小。在大多数的实际操作中,我们一般都是控制住犯第一类错误的概率,即设定好显著性水平α,然后通过增大样本容量来降低第二类错误发生的概率β。
本内容节选自《Stata统计分析从入门到精通》 杨维忠、张甜 清华大学出版社。关于学习Stata与计量经济学的问题,如果大家只是为了写论文,而不是专门的计量经济学专业、研究计量理论方法的,推荐学习路径如下:如果是新手可以先学习这本书《Stata统计分析从入门到精通》 杨维忠、张甜 清华大学出版社。?
2022年新书,山东大学陈强教授作序推荐。
本书专为计量经济学基础薄弱或学不进去,但又有写论文的读者入门所设计,注重应用,较少数学推导。边看书边操作,学的差不多了以后,再多看你目标研究领域的高质量的研究文献,看看人家用的什么方法,比如政策效应检验、结构方程模型等等,再针对性的学习那些相对较难、比较专业的方法就可以(到了那个阶段和层次,基本就可以通过看文献自学了;而针对一些前沿的方法或者要更加系统的学习,参加陈强老师的培训班也是一个很好的选择)。
创作不易,恳请多多点赞,欢迎大家多多关注我,一起学习Stata/SPSS/Python,感谢大家的厚爱支持!