本篇文章即为概率与分布的最后一篇文章。
分位数函数是累积分布函数的反函数。
p-分位数是具有这样性质的一个值:小于或等于它的概率为p。
根据定义,中位数即50%分位数。
分位数通常用于置信区间的计算,以及与设计试验有关的势函数的计算。
下面给出一个置信区间计算的简单例子:如果𝜎= 12,测量了n=5个观测值,得到均值,通过相关的分位数得到𝜇的一个置信度为95%的置信区间:
xbar=83
sigma=12
n=5
sem=sigma/sqrt(n) #标准误
sem
[1] 5.366563
xbar+sem*qnorm(0.025)
[1] 72.48173
xbar+sem*qnorm(0.975)
[1] 93.51827
qnorm():输入的是小于或等于这个分位数的概率为p,区间为0—1,输出的是z-score(分位数)
由于标准正态分布的对称性,
通常把置信度为95%的置的置信区间写成
统计量的抽样分布的标准差,简称标准误差
衡量统计量的离散程度
在参数估计与假设检验中,用于衡量样本统计量估计总体参数的精确程度
样本均值和样本比例的标准误分别为
当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误(在统计软件中得到的都是估计标准误)
以样本均值为例:当总体标准差?未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为
标准误与前面讲的标准差是两个不同的概念。标准差是根据原始观测值计算,反映一组原始数据的离散程度。而标准误是根据样本统计量计算的,反映统计量的离散程度的。