0x01 假设检验基础

假设检验

与参数估计的区别

假设检验参数估计是统计推断的两个部分, 都是利用样本对总体进行某种判断, 但推断的角度不同, 主要体现在:

  • 参数估计是用样本统计量估计总体参数的方法, 总体参数θ\theta在估计前是未知的

  • 假设检验首先对θ\theta的值提出一个假设, 然后利用样本信息去检验这个假设是否正确.

假设检验的基本问题

  • 原假设: 用一个等式或者不等式表示问题的原假设(null hypothesis), 原假设用H0H_0表示.

    原假设一般是我们想要否认的情况, 通常会通过假设检验否认这个问题, 从而它的相反观点得到支持.

  • 备择假设: 如果原假设不成立, 就要拒绝原假设, 而需要在另一个假设中做出选择, 这个假设称为备择假设(alternative hypothesis).

    原假设与备择假设互斥.

假设检验的两类错误

我们依据样本提供的信息进行判断, 其实本质是由部分推断总体, 因此得出的判断结论就有可能是错误的. 所犯的错误有两种类型:

  • 第I类错误: 原假设H0H_0为真, 但是被我们拒绝了, 这种错误的概率用α\alpha表示, 也称为α\alpha错误或弃真错误

  • 第II类错误: 原假设为假, 但是我们接受了, 这种错误的概率用β\beta表示, 也称为β\beta错误或取伪错误

对于一定的样本量nn, 不能同时做到减小这两类错误, 想减少某类错误的概率, 另一类错误的概率就会增加. 只有增大样本量, 才能同时降低两类错误的概率.

一般采用控制α\alpha错误的原则, 这是因为原假设通常都是明确的, 而备择假设通常是模糊的.

假设检验中两类错误的情况如下图所示:

假设检验的流程

  • 提出原假设和备择假设

  • 确定适当的检验统计量, 并计算其数值. 参数的假设检验如同参数估计, 借助样本统计量进行统计推断, 这里将这个统计量称为检验统计量.

  • 进行统计决策. 假设检验的原理是利用小概率原理, 即发生概率很小的随机事件在一次试验中是几乎不可能发生的.

    • 判断的标准是: 将计算得到的检验统计量的数值指定的一个小概率在选择的统计量所对应的分布中, 对应的坐标值进行比较

    • 或者相反, 将检验统计量的数值转换成按照原假设成立情况下, 对应分布所对应的拒绝域对应的概率值, 再与指定的小概率进行比较

    • 两者的本质是相同的

利用P值进行决策

P值就是当原假设为真时, 得到的当前样本结果或更极端结果出现的概率. 如果P值很小, 说明这种情况发生的概率很小, 根据小概率原理, 我们就有理由拒绝原假设.

P值是通过计算得到的, P值得大小与三个因素有关:

  • 样本数据与原假设之间的差异

  • 样本量

  • 被假设的参数的总体分布

P值反应了观察到的实际数据与原假设之间不一致的概率值, 根据事先确定的显著性水平α\alpha, 针对单侧检验双侧检验, 分别根据P<α/2P<\alpha/2P<αP<\alpha拒绝原假设.

注意:

  • 对于P值的使用, 需要注意的一点是, P值的大小与样本量有关, 需要特别注意样本量的大小, 较大的样本会提高显著性检验的敏感度, 这是因为大样本量的情况下方差一般会因样本量的增多而减小, 导致相同的差距使用方差衡量会变大.

    因此显著性检验不仅要看最后得出的P值, 也要参考做出这次检验的样本量nn.

  • 置信区间可以估计未知总体参数的值, 同时告诉我们不确定的程度有多大; 而显著性检验只度量不利于原假设的证据的强度.

检验假设的解释

  • 对于显著性水平为α\alpha的检验准则而言, 如果出现拒绝H0H_0的结果, 可以说, 结论H1H_1为真的出错概率为α\alpha.

  • 把假设检验中出现接受H0H_0的结果解释为没有发现充足的证据反对H0H_0, 但不能说原假设是真的. 即不拒绝H0H_0不能保证H0H_0为真, 这是在规定的显著性水平上无法拒绝原假设.

  • 小概率原理, 备择假设在一次试验中不容易发生, 但一旦发生, 我们就有充足的理由推翻原假设.

最后更新于

这有帮助吗?