SAS统计分析编程笔记
?
DATA步:
进行数据管理和操作的基本步骤,主要功能包括:建立SAS数据集,导入外部程序数据文件,分割、合并、修改、更新现有的的SAS数据集,分析、呈现和管理数据,利用数据集中已有数据计算或生成新变量等。编程语言包括:
infile “D:\\student.txt”; 获取外部数据;
input height weight; 指定读入数据的格式以及变量名
cards; 用于在SAS系统中直接输入数据,表明所列示数据的开始。 ?
PROC 步:
可引用现有的程序或过程进行相应的数据处理和分析活动。主要语法包括: proc 过程名 <选项>;
< var < 变量名1 变量名2… 变量名n>>; < where < 条件或表达式>>;
< by < 变量名1 变量名2… 变量名n>>; run; 过程包括:
PRINT:显示数据集的变量名及变量值 SORT:升降序排列
MEANS:均值、标准差、极值等统计量
UNIVERIATE:常见统计量、t检验、分位数、极端值等 FREQ:频数、频率、累计频数、累计频率 CHART:饼图、横向/纵向直方图、星形图
1
? SAS编程语言表达式:
+(加)、-(减)、*(乘)、/(除)、**(乘方)、=(等于)、<(小于)、>(大于)、<=(小于等于)、>=(大于等于)、><(不等于)、and(和)、or(或)、xor(异或)
? 条件语句: if 条件或表达式 then
…; /*当条件或表达式满足时执行的程序*/ else
…; /*当条件或表达式不满足时执行的程序*/
例如:比较两个变量的大小,如果x>y,则输出“x>y”;如果x x=10; y=20; /*现假定x赋值为10,y赋值为20*/ if x>y then put “x>y”; /*在“log”窗口中显示引号内的字符*/ else if x run; /*点击小人,则在“log”窗口中输出结果“x ? 循环语句: 1) 计数循环: do 计数变量=初始值 to 终止值 by 步长; …; end; /*如果by步长省略,则表示计数按照默认步长1计数。步长也可为负数,此时初始值应大于终止值*/ 例如: 2 data; data; y=0; y=0; do x=1 to 99 by 2; do x=99 to 1 by -2; y=y+x; y=y+x; end; end; put “y=” y; put “y=” y; run; run; /*两组公式都是计算1-100之内的所有奇数自然数之和,log窗口中应显示结果“y=2500”*/ 2) 当循环: do while (继续循环条件表达式); …; end; 该语句回先判断条件表达式是否成立,如果成立,则系统执行DO WIHILE中的语句,遇到END时返回条件表达式的判断。如此重复,知道条件表达式不能满足为止。 例如: data; x=1; y=0; do while (x<100); y=y+x; x=x+2; end; put “y=” y; run; /*显示结果应也为“y=2500”*/ 3) 直到循环: do until (退出循环条件表达式); …; end; 先执行循环语句内部程序,然后判断条件是否成立,如成立则退出循环。 例如: data; x=1; y=0; 3