回归分析是经典的数据分析方法之一,应用范围非常广泛,深受学者们的喜爱。它是研究分析某一变量受到其他变量影响的分析方法,基本思想是以被影响变量为因变量,以影响变量为自变量,研究因变量与自变量之间的因果关系。回归分析通过建立回归方程,使用各自变量来拟合因变量,并可使用回归方程进行预测。
最近很多学生快期末考试了,问我Stata回归结果该怎么分析,我在《Stata统计分析从入门到精通》 杨维忠、张甜 清华大学出版社一书中“6.1.3 最小二乘线性回归分析示例” 的解答可供参考。
本节我们使用数据6。数据6记录的是XX生产制造企业1997-2021年营业利润水平(profit)、固定资产投资(invest)、平均职工人数(labor)、研究开发支出(rd)等数据,如图所示。
下面我们以营业利润水平作为因变量,以固定资产投资、平均职工人数、研究开发支出作为自变量,开展线性回归分析。
我们打开数据文件,在主界面的命令窗口依次输入命令:
regress profit invest labor rd
本命令的含义是以营业利润水平作为因变量,以固定资产投资、平均职工人数、研究开发支出作为自变量,开展线性回归分析(regress命令后面紧邻的第一个变量是因变量,其他所有的变量都是自变量)。分析结果如图所示。
从上述分析结果中可以得到很多信息,可以看出共有25个样本参与了分析( Number of obs = 25),模型的F值(3, 21) =1650.89,P值(Prob > F)= 0.0000,说明模型整体上是非常显著的。模型的可决系数(R-squared)为0.9958,模型修正的可决系数(Adj R-squared)= 0.9952,说明模型的解释能力是非常高的。
模型的回归方程是:
profit=2.859037*invest+2.6269*labor+3.127479*rd-315.6367
变量invest的系数标准误是0.9396771,t值为3.04,P值为0.006,系数是非常显著的,95%的置信区间为[0.904872,4.813203]。变量labor的系数标准误是0.413203,t值为6.36,P值为0.000,系数是非常显著的,95%的置信区间为[1.767598,3.486203]。变量rd的系数标准误是1.151358,t值为2.72,P值为0.013,系数是非常显著的,95%的置信区间为[0.7330987,5.52186]。常数项的系数标准误是474.8465,t值为-0.66,P值为0.513,系数也是非常显著的,95%的置信区间为[-1303.134,671.8607]。
从上面的分析可以看出固定资产投资、平均职工人数、研究开发支出3个自变量对于因变量的营业利润水平都是正向显著影响,自变量每一单位的增长都会显著引起因变量的增长。
本节内容选自《Stata统计分析从入门到精通》 杨维忠、张甜 清华大学出版社“6.1.3 最小二乘线性回归分析示例” 2022年新书,山东大学陈强教授作序推荐。原书内容更加详细、细致,强烈推荐阅读。
本书专为计量经济学基础薄弱或学不进去,但又有写论文、做研究需要的读者设计,达到“弯道超车”的效果。大家可以学不会复杂的计量经济学,尤其是那些枯燥的数学推导,但一定要会用Stata,Stata的作用相当于把那些计量经济学公式嵌入到了软件中,会操作命令就能完成实证研究。换言之,您可以不懂汽车发动机、传动等原理,只要会开车就可以了。
本书的特色在于,一是详解了常用统计分析方法的Stata操作,不仅对涉及的基本命令进行循序渐进的阐述,明确说明了命令中各个选项的适用情形,并对分析结果进行了深入浅出、全面准确的解读,使得读者能够掌握每种分析方法的Stata操作,并能够根据实际应用与研究的需要灵活地选取恰当的分析方法或者设置相应的命令选项;二是所有的案例都非常真实和实用,不仅是为了教会读者使用Stata操作,更重要的是指导读者如何将Stata用于自己的学术论文写作或日常工作。
该书通过大量的示例和应用案例“详解统计分析原理、详解Stata命令选项设置、详解Stata输出结果”以及每章后的“重点内容回顾与习题练习”,帮助读者应用常用统计分析软件Stata的方法来解决实际工作的问题,提高工作质量和效率。
配套思维导图、PPT、全套讲解视频等学习资料(扫描书内二维码下载)。