一、打开和查看数据
1 窗口执行方式
2 命令互动执行方式
导入数据:
use "D:\Stata9\auto.dta", clear
非dta文件:
import delimited "E:\one_day_data.csv"
3 批量程序执行方式
4 小结
三种操作方式可以完成同样的任务。在初学命令的时候,当不记得某个命令时可以采用菜单操作方式得到该命令的用法。在结果窗口和命令回顾窗口都出现该命令,在命令窗口重复输入相应的命令,即可获得和窗口式操作同样的结果。如果将回顾窗口的命令保存,即得到程序,执行程序也得到同样的结果。使用 STATA 时建议大家采用第三种方式,即写程序的方式,程序可以使得数据的处理和分析过程被完整保留下来,便于自己和他人进行修改和评论。
二、寻求帮助与网络资源
1 获取帮助的命令
. help
显示出 STATA 所有帮助内容的目录结构。如果输入具体的命令,则只显示该命令的帮助,如
. help summarize
也可以通过菜单式的点选方式获得帮助: Help>>stata command…在弹出的对话框中输入:summarize 然后回车,得到与 help summarize 同样的结果。使用帮助的小窍门:先看命令描述(Description)部分,然后直接看帮助文件后面的命令示例(Examples),将命令示例复制到命令窗口,执行,看看执行结果,体会命令的用法。网络帮助可以采用如下命令获得
. findit scat3, net
. search scat3, net
这两条命令等价,均为寻找绘三维立体图的命令scat3。由于scat3不是STATA内置命令,所以需要通过这两个命令搜索并下载安装后才能使用。
三、命令示例
1 进行四则运算
. di 5+9
. di 5-9
. di 5*9
. di 10/2
. di 10^2
. di exp(0)
. di ln(1)
. di sqrt(4)
上述运算分别为加、减、乘、除、幂、指、对和开方,其中 di 为 display 的简写,是一个 STATA 命令,该命令显示计算结果。
2 描述统计
任务:求价格和重量的观察值个数、平均值、标准差、最小值和最大值
. use auto, clear
. sum price
. sum weight
//这两步命令也可以一步完成
. sum price weight
3 绘图
任务:绘出价格和重量的散点图和折线图
. scatter price weight
. line price weight, sort
4 生成新的数据
任务:生成新的数据 x, (x=1,2,…1000); y=x+100.
. clear //清除内存
. set obs 1000 //将数据指针定位到 1000 处
. gen x=_n //生成一个 1 到 1000 的边疆自然数,变量名为 x
. gen y=x+100 //生成一个新的变量 y,y 从 101 到 1100
5 控制结果输出显示
. list n
显示完一屏后会停住,此时按回车键和”l”会显示下一行;按”q”会终止命令,
或者使用 ctrl+break;按其他键会显示下一页。
6 注释
(1) 在最前面加上“*”号表示该行为注释语句,STATA 将只显示不执行;
(2) 在一个命令的中间加入注释,要用: /注释内容/
(3) 对较长的命令或者为便于阅读,将一行命令写成几行时,用///来分开
(4) 在命令行的后面加入注释: //注释语句
四、几个环境设置
1 设置屏幕滚动
在列示 1 到 1000 之前,若先设置 set more off,则屏幕不停止;反之 set more on 会使显示停止。
. set more off
. list
. set more on
. list
. q
2 清除内存中原有内容
3 设置内存大小
查看内存使用情况
. memory
//设置内存
. set memory 10m
4 设置文件存取路径
在打开数据之前,先要定位数据的位置,其命令为
. cd d:/stata17
如果想知道当前路径下有哪些文件,可以用 dir 命令来列示
. dir
假设你想在 D 盘的根目录下创建一个新的文件夹 mydata 来存放数据文件,
命令为 mkdir。
mkdir d:/mydata
然后,进入该目录,命令为 cd
. cd d:/mydata
5 错误提示
学会从 STATA 的错误提示中明白错在哪里非常重要。
. list myvar
上述命令试图显示变量 myvar,但是结果窗口仅出现如下的显示
variable myvar not found
r(111);
红色信息表明,没有找到一个叫 myvar 的变量,的确,我们的数据中并没有这个变量。List 巧妇难为无米之炊。
红色信息下面还有一个天兰色的 r(111),用鼠标点击,即可弹进一个帮助信息框,给出错误的更详尽解释。
再比如,我们在求五数时,误把 sum 写成了 sun
. sun
unrecognized command: sun
r(199);
显示说不认识 sun 这个命令。
附录:常用命令
需求帮助
•help 帮助
•net search 网络帮助
•search 网络寻求帮助
进入某路径
• cd
设定内存
• set memory 20m 设置 STATA 的内存空间为 20m
打开和保存数据
•clear 清空内存数据
•use 打开STATA格式的数据文件
•compress 将内存中的数据压缩
•save 保存内存中的数据
导入数据
•input 录入数据
•edit 编辑数据
•infile 导入数据
•infix 导入数据
•insheet 导入数据
重整数据
• append 将有相同结果的数据纵向拼接(观察值拼接)
• merge 将两个数据文件横向拼接
• xpose 数据转置
• reshape
• generate 生成新的数据
• egen 生成新的数据
• rename 变量重命令
• drop 删除变量或观察值
• keep 保留变量或观察值
• sort 对观察值按从小到大顺序重新排列
• encode 数值型数据转换为字符型数据
• decode 字符型数据转换为数值型数据
• order 变量顺序的重新排列
• by 分类操作
报告数据
• describe 总体展示数据情况
• codebook 展示数据库中的每个变量情况
• list 列示内存中的数据
• count 报告共有多少观察值
• inspect 报告变量的分布
• table 数据列表
• tabulate 联列表
显示和保存输出结果
• display 显示计算结果
• log 将输出结果存放入结果文件
截面数据常用命令
arima ARMA回归检验
arch 自回归条件异方差检验
dfgls 单位根检验
corrgram 相关图估计
var 向量自回归
irf 脉冲响应函数,方差分解
vec 向量误差修正模型(协整)
面板数据常用命令
xtreg,fe 固定效应模型
xtreg,re 随机效应模型
xtgls 使用广义最小二乘法的面板数据模型
xtivreg 工具变量面板数据估计
xtlogit 面板数据logit模型
xtprobit 面板数据probit模型
xtpois 面板数据泊松回归
xtgee 使用广义估计方程的面板数据模型
xtmixed 线性混合模型
参考文献
- STATA公司官方网站 http://www.stata.com
- —官网支持jupyter-notebook:https://www.stata.com/new-in-stata/jupyter-notebooks/
- —官网支持python:https://www.stata.com/new-in-stata/pystata/