变量及变量相关参数是数据的组织逻辑
一? ?变量名称
变量:在数据结构中,每一列是一个标签,也就是一个变量,每一行则是一条数据
stata的命名规则:
- 变量名最多32个字符,16个汉字
- 字符组成:A~Z,a~z,0~9,以及下划线“-”
- 区别变量名的大小写
二? ?变量的取值类型
字符串变量
- 字符变量通常是一些需要用文字描述的信息,常由字母或一些特殊符号组成
- 字符串变量也可以由数字来组成,但数字在这里仅代表一些符号而不再是数字
- 字符串变量通常以英文引号""标注,而且引号不属于字符串的一部分,字符串最多可达244个字符,一般用str#来表示字符的
数值型变量
数值型变量按其精度又可分为五种类型:byte、int、long、float、double。类似于Access中的字节型、整型、长整型、浮点型和双精度型。不同的精度对应着不同的计算运算误差。
缺失数据
stata有27个代码表示缺失值:,,a,b,c,......,z? ?一般用","
三? ?变量的显示方式
数值型变量的显示格式
f格式(固定格式)? ? ? ?
显示方式:%w.df? ? %w.dfc
w:表示整个显示所占的字符数及宽度
d:代表小数点后的位数
c:可加可不加,加了后则是数据带“,”
g格式(普通格式)? ? ? ?
显示方式:%w.dg??? %w.dgc
w:表示整个显示所占的字符数及宽度
d:代表小数点后的位数
c:可加可不加,加了后则是数据带“,”
变化格式:自动调节d值
e格式(科学计数法格式)
?显示方式:%w.de???
w:表示整个显示所占的字符数及宽度
d:代表小数点后的位数
字符型的变量显示格式
f格式(固定格式)
显示方式:%#s
#:字符个数
s:表示字符串显示格式
%22s:表示22个字符的字符变量显示格式
使用format命令规范变量的显示格式
显示变量的格式
Format[var]? ? ? ? var指变量
更改变量的格式
Format[var]%fmt? ? ? ?fmt为更改后
四? ?数据显示
describe命令
产生一个对数据集的简明总结表格
函数介绍?
?describe[varlist] [, memory-options]? ?
stata中的一些逻辑
- “[.]”、[,..]”都属于数的参数,只要是被“[]”框住的,都是可有可无
- 重要的命令:help,例如:“help describe” 可调出该命令的表示函数相关信息
- 在帮助中,看options? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 例:? ? ? ?仅显示变量名称
- “simple”下划线代表缩写
list命令
显示变量的数值,后面可以加显示什么变量
函数介绍? ??
?list [varlist] [irl in] [, options]
常用的options
- ?noobs,不显示观测值的数值
- ?clean,不显示分隔线
- sepby(var),每当var变量发生变化时画一条分割线
codebook命令
详尽地描述变量内容,包括名称,标签和复制
函数介绍? ???
codebook [varlist] [if] [in] [, options]
感谢收看 ,共勉~