1.6 定义数据的子集

1.6.1 定义数据的子集概述

在很多情况下,现有的Stata数据达不到分析要求,我们需要截取出数据的一部分进行分析,或者删除不需要进入分析范围的数据,这时我们就需要用到Stata的定义数据子集功能。在本节中,我们将通过实例的方式讲述定义数据子集的基本操作。

1.6.2 相关数据来源

【例1.5】试通过操作案例1.5.dta完成以下工作。

(1)列出第3条数据。

(2)列出第1~3条数据。

(3)列出变量值“shangjiao”最小的两条数据。

(4)列出变量值“year”大于2005的数据。

(5)列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。

(6)删除第3条数据。

(7)删除变量值“year”等于2005的数据。

(8)删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。

1.6.3 Stata分析过程

分析步骤如下:

进入Stata 14.0,打开相关数据文件,弹出如图1.30所示的主界面。

图1.30 主界面

在主界面的“Command”文本框中输入操作命令并按键盘上的回车键进行确认。对应的命令如下。


●list in 3:本命令的含义是列出第3条数据。

●list in 1/3:本命令的含义是列出第1~3条数据。

●sort shangjiao list year shangjiao shenjiao in 1/2:本命令的含义是列出变量值“shangjiao”最小的两条数据。

●list if year>2005:本命令的含义是列出变量值“year”大于2005的数据。

●list if year>2007 & shangjiao>865:本命令的含义是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。

●drop in 3:本命令的含义是删除第3条数据。

●drop if year==2005:本命令的含义是删除变量值“year”等于2005的数据。

●drop if year>2005 & shangjiao>865:本命令的含义是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。

1.6.4 结果分析

图1.31是列出第3条数据的结果。

图1.31 分析结果1

图1.32是列出第1~3条数据的结果。

图1.32 分析结果2

图1.33是列出变量值“shangjiao”最小的两条数据结果。

图1.33 分析结果3

图1.34是列出变量值“year”大于2005的数据结果。

图1.34 分析结果4

图1.35是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据结果。

图1.35 分析结果5

图1.36是删除第3条数据的结果。

图1.36 分析结果6

图1.37是删除变量值“year”等于2005的数据结果。

图1.37 分析结果7

图1.38是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据结果。

图1.38 分析结果8

1.6.5 案例延伸

我们在上述的Stata命令中用到了Stata中的关系运算符和逻辑运算符。Stata 14.0中共支持6种关系运算符和3种逻辑运算符,如表1.7和表1.8所示。

表1.7 关系运算符

表1.8 逻辑运算符