独立样本T检验过程依据的基本原理也是统计学中的“小概率反证法”原理。即小概率事件在一次试验中基本上不会发生,其统计推断方法是带有某种概率性质的反证法,也就是说先提出检验的原假设和备择假设,再用适当的统计方法,利用小概率原理确定原假设是否成立。简单来说,就是提出原假设后,首先假定原假设是可以接受的,然后依据样本观测值进行相应的检验,如果检验中发现小概率事件发生了,也就是说基本不可能发生的事件发生了,就说明原假设是不可接受的,应拒绝原假设,接受备择假设。如果检验中小概率事件没有发生,就接受原假设。通过独立样本T检验,我们可以实现两个独立样本的均值比较。
ttest varname1 == varname2 [if] [in], unpaired [unequal welch level(#)]
ttest表示进行T检验,varname1、varname2为用来进行独立样本T检验的两个变量,[if]为条件表达式,[in]用于设定样本范围,unpaired表示是独立样本而不是配对样本,unequal表示非配对数据具有不同方差,welch表示使用Welch近似法,level(#)用来设置置信水平。
本例中我们使用数据3B进行解释,数据集中有两个变量,分别是amounta和amountb,如图所示。
打开数据文件,在主界面的命令窗口依次输入以下命令:
ttest amounta = amountb, unpaired
本命令的含义是使用独立样本T检验过程检验amounta与amountb之间是否存在明显的差别,结果如图所示。可以看出,共有80个有效样本参与了假设检验,自由度为78,其中变量amounta包括40个样本,均值为2703.5,标准误为37.00927,标准差为234.0672,95%的置信区间是[2628.642,2778.358];变量amountb包括40个样本,均值为2099,标准误为21.9434,标准差为138.7822,95%的置信区间是[2054.615,2143.385]。Pr(|T| > |t|) = 0.0000远小于0.05,需要拒绝原假设,也就是说,amounta 与 amountb之间存在明显的差别。
上述内容节选自《Stata统计分析从入门到精通》 杨维忠、张甜 清华大学出版社。
关于学习Stata与?计量经济学的问题,如果大家只是为了写论文,而不是专门的计量经济学专业、研究计量理论方法的,推荐学习路径如下:如果是新手可以先学习这本书《Stata统计分析从入门到精通》 杨维忠、张甜 清华大学出版社。
2022年新书,山东大学 ?陈强教授作序推荐。
本书专为计量经济学基础薄弱或学不进去,但又有写论文的读者入门所设计,注重应用,较少数学推导。边看书边操作,学的差不多了以后,再多看你目标研究领域的高质量的研究文献, ?看看人家用的什么方法,比如 ?政策效应检验、 ?结构方程模型等等,再针对性的学习那些相对较难、比较专业的方法就可以(到了那个阶段和层次,基本就可以通过看文献自学了;而针对一些前沿的方法或者要更加系统的学习,参加陈强老师的?培训班也是一个很好的选择)
《Stata统计分析从入门到精通》 杨维忠、张甜 清华大学出版社 共17章。具体来说,第1章为Stata基本操作及数据处理介绍,内容包括Stata概述、Stata 16.0窗口说明及基本设置、Stata帮助系统、Stata 16.0基本命令语句结构、Stata 16.0运算符与函数、分类变量和定序变量的基本操作、常用的几种处理数据的操作。第2章为描述性统计与图形绘制,内容包括常用的描述性统计指标的基本概念、定距变量的描述性统计、正态性检验和数据转换、分类变量描述统计、制图基本操作、常用的几种图形的绘制。第3章为假设检验,内容包括假设检验的基本概念、单一样本T检验、独立样本T检验、配对样本T检验、单一样本标准差和双样本方差(标准差)等参数检验方法,以及单样本正态分布检验、两独立样本检验、两相关样本检验、多独立样本检验、游程检验等非参数检验方法。第4章为方差分析,内容包括单因素方差分析、多因素方差分析、协方差分析、重复测量方差分析4种方差分析方法。第5章为相关分析,内容包括简单相关分析、偏相关分析两种相关分析方法。第6章为基本线性回归分析,内容包括最小二乘线性回归分析、约束条件回归分析两种回归分析方法。第7章为线性回归分析诊断与处理,内容包括异方差诊断与处理、自相关诊断与处理、多重共线性诊断与处理、内生性诊断与处理等方法。第8章为非线性回归分析,内容包括转换变量回归分析、非线性回归分析、非参数回归分析、分位数回归分析四种分析方法。第9章为因变量离散回归分析,内容包括二值选择模型、多值选择模型、有序选择模型3种分析方法。第10章为因变量受限回归分析,内容包括断尾回归分析、截取回归分析、样本选择模型3种分析方法。第11章为主成分分析与因子分析,内容包括主成分分析、因子分析两种分析方法。第12章为聚类分析,内容包括划分聚类分析、层次聚类分析两种聚类分析方法。第13章为时间序列数据分析,内容包括时间序列数据的预处理、移动平均滤波与指数平滑法、ARIMA模型、SARIMA模型、ARIMAX模型、单位根检验、向量自回归模型、协整检验与向量误差修正模型、ARCH系列模型等方法。第14章为面板数据分析,内容包括面板数据的预处理、短面板数据分析、长面板数据分析等方法。第15章为生存分析,内容包括设定生存分析数据、生存分析非参数模型估计、生存分析参数模型估计、Cox半参数模型估计、比例风险假定检验等方法。第16章为多方程模型,内容包括多方程模型概述、多方程模型的估计。第17章为如何使用 Stata 进行高质量的综合性研究。
本书的特色在于,一是精解了常用统计分析方法的Stata操作,不仅对涉及的基本命令进行了阐述,明确说明了命令中各个选项的适用情形,并对分析结果进行了深入浅出、全面准确的解读,使得读者能够掌握每种分析方法的Stata操作,并能够根据实际研究的需要灵活地选取恰当的分析方法或者设置相应的命令选项;二是所有的案例都非常真实和实用,不仅是为了教会读者使用Stata操作,更重要的是指导读者如何将Stata用于自己的日常工作。
创作不易,恳请多多点赞,欢迎大家多多关注我,一起学习Stata/SPSS/Python,感谢大家的厚爱支持!