一文讲透使用Stata统计分析软件对数据进行排序

发布时间:2024年01月04日

在很多应用场景,用户需要对数据进行排序处理。Stata排序命令主要为sort命令和gsort命令。

sort命令的语法格式为:

sort varlist [in] [, stable]

varlist代表将要进行排序的变量,[in]代表排序的范围,[, stable]的含义是如果两个观测值相同,其顺序保持与原数据相同。

gsort命令的语法格式为:

gsort [+|-] varname [[+|-] varname ...] [, generate(newvar) mfirst]

其中[+]表示按升序排列,[-]表示按降序排列,Stata默认升序排列。generate(newvar)表示排序之后生成新的变量,mfirst表示将缺失值排在最前面。

此处以本书附带的“数据1E”数据文件为例进行说明,在命令窗口中输入:

use "C:\Users\Administrator\Desktop\数据1E.dta" (本命令的含义是打开“数据1E”数据文件)

sort y5 (本命令的含义是将“数据1E”数据文件中的样本观测值按变量y5从小到大排列)

上述命令的执行结果如图1.63和图1.64所示,其中图1.63为排序前的数据,图1.64为排序后的数据。

图1.63 排序前的y5数据

图1.64 排序后的y5数据

该操作也可以使用gsort命令完成,命令为:

gsort + y5

读者可以自行执行一遍,查看执行结果是否与上述结果相同。

本案例节选自《Stata统计分析从入门到精通》 杨维忠、张甜 清华大学出版社。关于学习Stata与计量经济学的问题,如果大家只是为了写论文,而不是专门的计量经济学专业、研究计量理论方法的,推荐学习路径如下:如果是新手可以先学习这本书《Stata统计分析从入门到精通》 杨维忠、张甜 清华大学出版社。

2022年新书,山东大学陈强教授作序推荐。

本书专为计量经济学基础薄弱或学不进去,但又有写论文的读者入门所设计,注重应用,较少数学推导。边看书边操作,学的差不多了以后,再多看你目标研究领域的高质量的研究文献,看看人家用的什么方法,比如政策效应检验结构方程模型等等,再针对性的学习那些相对较难、比较专业的方法就可以(到了那个阶段和层次,基本就可以通过看文献自学了;而针对一些前沿的方法或者要更加系统的学习,参加陈强老师的培训班也是一个很好的选择)。

创作不易,恳请多多点赞,欢迎大家多多关注我,一起学习Stata/SPSS/Python,感谢大家的厚爱支持!

文章来源:https://blog.csdn.net/m0_72274883/article/details/135384841
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。