《Stata统计分析与应用(第2版)》一2.2 数据的导入

2.2 数据的导入

能够将不同形式的数据正确导入是运用Stata进行数据分析的第一步,本节将针对此来进行介绍。

2.2.1 输入数据

在现实的经济学研究中,大部分数据都是由用户自行输入创建的,所以本节首先介绍两种输入数据的方法:一种是通过菜单方式输入,另一种是通过命令方式输入。

  1. 使用菜单方式输入数据
    假定要创建一个成绩数据表(chengji.dta),内容如表2.8所示,利用Stata的菜单操作的方法如下。

首先,单击工具栏中的图标,则会弹出数据编辑器,在其中输入相应数据,如图2.8所示。需要注意的是,每当输入完一个单元格的内容之后,需要按回车键确认。
其次,需要给变量命名。在所有数据输入完成之后,鼠标双击var1,将弹出如图2.9所示的对话框,在Name栏中填入变量的名称“name”,Label栏填入标签的内容为“姓名”,单击OK按钮完成操作。同样将var2命名为remarks。

最后,保存已经创建的数据文件。单击工具栏中的图标,然后给文件命名和选择存储路径即可。

  1. 使用命令方式输入数据
    首先必须了解数据输入的基本命令,具体语句如下:
input [type] varname [[type] varname] …

[type]表示输入的变量类型,若省略,则为Stata默认的float型;varname表示变量的名称。在这句命令之后,依次输入数据即可。
若要输入如表2.8所示的内容,可输入命令如下:

clear
input str10 name remarks
Mike 98
John 78
Ryan 86
Tom 67
Kite 96
end

save chengji(将数据文件保存在默认文件夹data中,文件名为chengji)
在以上命令语句中,clear表示清除内存;input str10 name remarks表示输入两个变量name和remarks,其中要将变量的类型写在名称前面,如str10表示name的类型为长度为10的字符型,而remarks前面没写数据类型,表示其类型为默认的浮点型;Mike 98~Kite 96表示数据的内容,一定要按照前面命令语句中变量name和remarks的顺序填写;end表示结束数据输入;save chengji将数据文件保存在默认文件夹data中,完整文件名为chengji.dta。
通过比较可以看出,利用命令方式实现数据的输入较为烦琐,所以一般并不使用。

2.2.2 使用已经保存的Stata数据

Stata默认的数据格式是.dta,这种格式的文件可以直接打开应用,命令为use,具体内容已在本章第2.1.1节做了详细介绍,这里不再赘述。

2.2.3 导入其他格式的数据

当数据文件为其他格式时,也可以导入Stata软件中进行处理,常用的命令主要有insheet、infile、infix命令,下面将通过实例进行详细介绍。

  1. 使用insheet命令,读取ASCII数据
    ASCII数据是指原始的文本数据,由电子表格和数据库程序生成的数据文件,每一行代表一个观测值(case),数值由逗号或制表符隔开,第一行可以包含变量名称,利用insheet读取时的基本命令语句如下:

insheet [varlist] using filename [,options]
在这个语句中,insheet代表导入数据的命令,[varlist] using filename代表数据文件中的某个变量,这里的options包括的选项及其含义如表2.9所示。

例如,将数据citywater.csv导入Stata中,就不能直接使用use命令了,.csv数据类型表示使用逗号分隔的一种数据类型,其具体格式如图2.10所示。

将其导入Stata的命令如下:

insheet using C:\data\citywater.csv
  1. 使用infile命令,读取没有固定格式的ASCII数据
    infile在某种程度上可以完成与insheet命令相同的功能,其与insheet命令的最大区别是前者必须指明变量名称,尤其是字符型变量。使用infile命令读取数据的基本命令语句如下:
infile varlist [_skip[(#)] [varlist [_skip[(#)] ...]]] using filename [if]
 [in] [, options]

例如,同样将数据citywater.csv导入Stata中,我们可输入如下命令语句:

infile year production capital labor using C:/data/citywater.csv

这个命令的操作结果与insheet命令相同。

  1. 使用infix命令,读取固定格式的ASCII数据
    这种固定格式的数据有固定的位数,当位数不够时,前面用0补齐,对于这种数据可用infix命令读入,其具体形式如下:
infix using dfilename [if] [in] [, using(filename2) clear]
infix specifications using filename [if] [in] [, clear]

例如,将下列一组数据(数据文件chengji.csv)转化成如表2.10所示的数据形式。chengji这组数据为用逗号隔开的数据类型,如图2.11所示,其中gender(性别)只有0和1两个数字组成,number(学号)这一栏必须由三位数组成,math和english的成绩必须由两位数组成,所以这是一个固定格式的数据,应该使用infix命令。

具体的命令语句为:

infix gender 1 number 3-5 math 7-8 english 10-11 using C:/data/chengji.csv,
clear

在这个命令语句中,“infix gender 1”说明第1位数据为性别,“number 3-5”表示第3~5位为学号,“math 7-8”表示第7~8位为数学成绩,“english 10-11”表示第10~11位为英语成绩,“using C:/data/chengji.csv”表示原始数据文件的路径。

时间: 2024-09-20 19:31:28

《Stata统计分析与应用(第2版)》一2.2 数据的导入的相关文章

《Stata统计分析与应用(第2版)》一导读

前 言 Stata与SAS.SPSS统称为三大权威统计软件,被广泛应用于统计学.经济学.生物学.医药学.社会学.人口学等领域,功能十分强大.与其他软件相比,Stata具有以下优势:操作简单,方便掌握:系统开放,及时更新:数据处理,功能强大:图形制作,精美优良等.Stata软件具有5大功能,分别为数据的基本处理.图形绘制.统计分析.回归与建模分析.编程等.该软件是由Stata公司在1985年推出的,虽然现在最新的版本为2009年推出的Stata 11.0,但是鉴于11.0版本还基本没有在我国推广和

《Stata统计分析与应用(第2版)》一2.1 数据的类型、压缩和转化

2.1 数据的类型.压缩和转化 数据是进行实证研究的基础,也是运用Stata进行分析的基石,所以本节主要讲解最基本的数据打开.Stata中的数据类型,以及数据压缩与转化等相关操作内容. 2.1.1 数据的打开 Stata一般能够识别的数据文件的后缀名为.dta,打开这些数据文件的命令为use.use命令的基本语句格式如下:use [varlist] [if] [in] using filename [, clear nolabel]在这个命令中,use是打开数据的命令语句,varlist代表变量

《Stata统计分析与应用(第2版)》一第2章 Stata中的数据处理

第2章 Stata中的数据处理 数据是整个Stata软件处理系统的基石,没有数据就没有操作的对象,就无法进行各种统计和计量分析,所以,得到原始数据后,如何进行初步的处理使之成为Stata能够识别的数据类型和格式,显得尤为关键.在现实研究分析中,我们不仅使用自己收集整理的第一手数据,有时还利用其他机构或个人提供的二手数据,这些数据在很多情况下不能直接被使用,需要进行一定程度的转换和重构,因此,本章就围绕数据处理这一中心,通过案例分别讲解数据的类型/压缩/转化.数据的导入.数据的整理等方面内容.

网页版的excel,进行数据的添加和修改

问题描述 网页版的excel,进行数据的添加和修改 怎样做到网页版的excel,进行数据的添加和修改 有没有什么控件或者脚本啊 解决方案 Office word excel在线编辑的实现方法 http://www.6excel.com/doc/20032

mac-Idea Mac版想使用Junit,怎么导入jar包

问题描述 Idea Mac版想使用Junit,怎么导入jar包 idea 的lib的lib目录下好像有,但idea不能进入.app的包内容 解决方案 idea中给HttpServlet导入jar包

《Stata统计分析与应用(第2版)》一1.3 Stata主要功能模块

1.3 Stata主要功能模块 Stata软件主要有数据处理.绘图.统计分析.回归与建模分析.编程这5大功能,其相互配合,可以完成系统完整的数据分析和处理任务. 1.3.1 数据处理 在得到第一手数据之后要做的就应是对数据进行基本的处理,数据处理功能主要包括数据的读入.类型转换.压缩等,此外还可以对数据进行基本的描述分析,包括频数分布.离散趋势.集中趋势的分析等.以上内容将在第2章中具体讲述. 1.3.2 绘图 图形是帮助数据分析的一个有力工具,Stata提供了强大的绘图功能,主要包括散点图.曲

《Stata统计分析与应用(第2版)》一3.1 图形制作的基本命令与相关操作

3.1 图形制作的基本命令与相关操作 一个完整的图形(见图3.1),主要包括以下几个部分:标题.副标题.坐标轴刻度与标题.图例说明.注释语句等.在Stata制图中,这些部分的设置均可以通过命令方式进行操作.最常用的操作流程即通过命令方式画出主体图形,细节的修改则通过菜单方式进行. 3.1.1 图形制作的基本命令 图形的制作可以通过命令的方式完成,基本命令形式如下: graph-command (plot-command, plot-options) (plot-command , plot-op

《Stata统计分析与应用(第2版)》一1.2 Stata窗口及基本操作

1.2 Stata窗口及基本操作 本节将介绍Stata的窗口组成和基本操作,读者在这里将逐渐熟悉Stata的操作界面与方法. 1.2.1 Stata窗口说明 Stata软件安装完成后,运行Stata,将会看到如图1.1所示的操作界面. 从图1.1中可以看出,Stata菜单栏主要包括File.Edit.Data.Graphics.Statistics.User.Window.Help这8个子菜单.由于Stata主要是通过命令进行操作,所以这里只是简要介绍一下各个菜单的功能. File的下拉菜单包括

《Stata统计分析与应用(第2版)》一3.4 图形的保存、合并及修改

3.4 图形的保存.合并及修改 绘制完图形之后,你可能需要对图形进行一些修改等操作,本节介绍与之相关的具体操作和命令语句. 3.4.1 图形的保存和已存图形的打开 图形绘制完成以后,需要对其进行保存,保存的命令语句是: graph save [graphname] filename [, asis replace] [graphname]为图形保存的名称,filename为保存的路径,特别需要强调的是[, asis replace]选项,它的作用是冻结图形,使其不能再被修改.已保存图形打开的命令