The little SAS book 学习笔记
第二章 将你的数据放入SAS
2.1 将你的数据放入SAS的方法
你可能有各种形式的数据,包括手写在纸上、存放在电脑上、或是在数据库管理系统里,不论如何,总有一种方法可以让SAS来读取。
SAS读取的数据的方法主要有以下几种类型: ? 直接输入;
? 从原始数据文件中创建一个SAS数据集(creating SAS data sets from raw data files); ? 将其他软件中的数据文件转换成SAS数据集; ? 直接读取其他软件的数据集;
直接输入
? View table窗口可以让你以表格形式输入数据,可以定义变量、设置属性,如name、length
和 type(character or numeric).
? SAS 企业向导模块,a Windows only application, has a data entry window that is very
similar to the View table window. As with View table, you can define variables and give them attributes.
? SAS/FSP 模块,是Full Screen Product的简称,可以设计定制的数据输入窗口,也有检
测数据输入错误的功能(The SAS/FSP product is licensed separately from Base SAS software.)。
从原始数据文件中创建一个SAS数据集 你有两种方法读取原始数据文件:
? 数据步可以读取任何形式的原始数据文件,这种方法还将在2.4中详解。 ? 导入向导(Import Wizard)、导入过程(IMPORT procedure)适用于UNIX、OpenVMS
和 Windows操作环境的简单方法,可以读取CSV(comma-separated values)和其他一些限定的文件类型。
将其他软件中的数据文件转换成SAS数据集 如果数据在一个软件中以某种格
式存放,但需要用另一种软件分析时,就会很麻烦。有几种方法可以将某种软件中的数据转换成SAS数据集:
? 如果安装SAS/ACCESS模块,可以用导入过程(import procedure)和导入向导(Import
Wizard)将Excel、Lotus、dBase和Access文件导入SAS数据集,见2.3和2.17(?)。 ? 如果没有安装,可以用存放数据的软件创建一个原始文件,并用数据步或导入过程
(import procedure)读取。很多软件都可以创建CSV文件。
? Windows操作环境下也可以用动态数据交换技术(Dynamic Data Exchange,DDE),见
2.18。前提是必须有一个其他的Windows程序与SAS同时运行,再使用DDE和数据步。
直接读取其他软件的数据集
? SAS/ACCESS产品可以不用转换数据格式读取数据,并适用于大部分数据库管理系统,包括ORACLE,DB2,INGRES和 SYBASE(但使用方法本书没有介绍)。 ? 使用Excel engine和Access engine来读取这两种类型的数据。(SAS帮助文档) ? 还有其他的一些数据引擎(data engines)来读取数据,如SPSS engine(附录D),查
找帮助文档找到适合你操作环境的所有有效engine。
2.2 用View table窗口输入数据
调用View table窗口,在工具栏的下拉菜单中选择表编辑器(Table Editor)。
列属性窗口 每一列顶部的字母是默认的变量名,右击变量名,即可打开列属性(column attributes)窗口,设置属性之后,点击应用(apply),设置完后关闭即可。
输入数据
保存表 选择文件(file)——另存为(save as),选择一个逻辑库保存,如果想保存
在新的逻辑库,点击创建新逻辑库图表(New Library),输入逻辑库的名字和保存路径。
打开一个已有的表 首先打开表编辑器,选择文件(file)——打开(open)。打开
之后,SAS默认的是浏览模式,如果要对数据进行编辑,则要在编辑(edit)菜单中选择编辑模式。也可以在资源管理器窗口中双击打开一个已有的表。
其他功能 其他一些功能包括排序、打印(printing)、增加和删除行、一次浏览一行
(表单视图Form View)、一次浏览多行(表视图 Table View)。图标和菜单都可以选择这些功能。
在SAS程序中使用表 如下程序语句可以将表内容输出打印:
PROC PRINT DATA=Sasuser.coffee; RUN;
2.3 用导入向导(Import Wizard)读取文件
导入向导会浏览你的文件以决定变量的类型,并默认数据表的第一行存放变量名。 第一步,从文件(file)下拉菜单中选择导入数据(import data)导入向导(Import Wizard)
第二步,从standard data sources中选择要导入的数据类型。以comma separated values