一文讲透使用Stata统计分析软件对数据进行排序

发布时间：2024年01月04日

在很多应用场景，用户需要对数据进行排序处理。Stata排序命令主要为sort命令和gsort命令。

sort命令的语法格式为：

sort varlist [in] [, stable]

varlist代表将要进行排序的变量，[in]代表排序的范围，[, stable]的含义是如果两个观测值相同，其顺序保持与原数据相同。

gsort命令的语法格式为：

gsort [+|-] varname [[+|-] varname ...] [, generate(newvar) mfirst]

其中[+]表示按升序排列，[-]表示按降序排列，Stata默认升序排列。generate(newvar)表示排序之后生成新的变量，mfirst表示将缺失值排在最前面。

此处以本书附带的“数据1E”数据文件为例进行说明，在命令窗口中输入：

use "C:\Users\Administrator\Desktop\数据1E.dta" （本命令的含义是打开“数据1E”数据文件）

sort y5 (本命令的含义是将“数据1E”数据文件中的样本观测值按变量y5从小到大排列)

上述命令的执行结果如图1.63和图1.64所示，其中图1.63为排序前的数据，图1.64为排序后的数据。

图1.63 排序前的y5数据

图1.64 排序后的y5数据

该操作也可以使用gsort命令完成，命令为：

gsort + y5

读者可以自行执行一遍，查看执行结果是否与上述结果相同。

本案例节选自《Stata统计分析从入门到精通》杨维忠、张甜清华大学出版社。关于学习Stata与计量经济学的问题，如果大家只是为了写论文，而不是专门的计量经济学专业、研究计量理论方法的，推荐学习路径如下：如果是新手可以先学习这本书《Stata统计分析从入门到精通》杨维忠、张甜清华大学出版社。

2022年新书，山东大学陈强教授作序推荐。

本书专为计量经济学基础薄弱或学不进去，但又有写论文的读者入门所设计，注重应用，较少数学推导。边看书边操作，学的差不多了以后，再多看你目标研究领域的高质量的研究文献，看看人家用的什么方法，比如政策效应检验、结构方程模型等等，再针对性的学习那些相对较难、比较专业的方法就可以（到了那个阶段和层次，基本就可以通过看文献自学了；而针对一些前沿的方法或者要更加系统的学习，参加陈强老师的培训班也是一个很好的选择）。

创作不易，恳请多多点赞，欢迎大家多多关注我，一起学习Stata/SPSS/Python，感谢大家的厚爱支持！

文章来源:https://blog.csdn.net/m0_72274883/article/details/135384841
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！