Stata笔记北京科技大学

改颜色edit-preference-general prefernce-classic

下面命令框-右键-font-改字号

命令cd d:\\ 改到d盘(change directory) dir查询d盘有什么

sysuse auto 系统自带汽车数据,数据变量(字段)显示在右上角 br(owse) 浏览数据(字符型红色,数值型黑色,蓝色-右键-value labels-hide all labels标签隐藏)

h(elp) li(st) 告诉你命令怎么用,下面有例子 左边双击执行,单击复制到命令框 order price mpg(单击右边的变量)

order make-foreign 改变变量顺序,从make到foreign

g(enerate) new=rep78-trunk 输出新变量(rep78,trunk是字段,可单击选择,\表示缺省,加减乘除+-*/)

list if new==14 (==为等于,=为赋值,可以点击more) li(st) if new2>=14 & new2<24 (按q可以退出,即quit) replace new3=rep78 (输错了替换) drop new new2 new3删除变量 list if new>10000

list make if new<10000|new>2000 (竖线表示或者,回车上面那个) !=表示不等于

左边命令,右键save

save data 文件名为data sysuse auto preserve reserve

save auto2 保存时不需加后缀,删除时带后缀.dta sort price从小到大

gsort price 都可以,比较随意

gsort -trunk price (默认加号,为排序) order make new (将new排到第二位) aorder (alphabetic 按字母顺序排序) disp(lay) sin(1) 作为计算器使用 ln以e为底

----------------3.13--------- 锐思数据库选择数据

-----非金融行业负债表---- 左边-财务报表-非金融行业 合并标识-1合并报表 调整标识-1

报表类型-q4、信息来源-q4 公司类别-20-定期报告 信息来源:q4 a股股票代码

截止日期

流动资产合计 应收账款 总资产

流动负债合计 负债合计

所有者权益合计

------非金融行业利润表--- 前同 净利润 营业收入

excel输出(默认)选择列表签+列名 ------打开STATA------

file-import-xls菜单引入文件 clear可清除数据

varible name 不识别中文

选中第一个import first row as varible names

第二个import all data as strings意思是将数据看作字符型(不选) br(ouse)展示数据

流动比率=流动资产/流动负债 资产负债率=总负债/总资产

产权比率=总负债/所有者权益合计 mkdir d:\\hsy1\\mydata 建立文件夹 cd d:\\hsy1\\mydata 基于文件夹 dir 显示文件夹

save bs 保存数据,名为bs

直接运行是双击,显示在框内为单击

g(enerate) currrate=Totcurass/Tutcurlia 流动比率(等号后面点右上方variables) 显示(8 missing values generated)有八个缺失值 g lev=Totlia/Totass 负债率leverage

g pright= Totlia/ TotSHE 产权比率porperty save bs2 另存数据 drop 为删除变量

clear从内存删掉,不会从硬盘删掉 ------利润表----- import save is

g incorate= Netprf/ Incmope 利润率=净利润/营业利润 save is2 ---- clear

use bs2 打开bs2

g year=year( EndDt) 。year(EndDt)表示从变量EndDt里把年份取出,如month() g month=month( EndDt) save bs3

----- clear . use is2

. g year=year( EndDt) . g month=month( EndDt) . save is3

----合并merge横向1对1合并,append纵向合并---

merge 1:1 A_Stkcd year using bs3注意后面的两个变量名字在原来两个表里是相同的,将bs3合并到现在(is3)中 错误类型variables A_Stkcd year do not uniquely identify observations in the master data

而master data指主数据库,using data 从数据库 (替换变量名Stked 改成A_Stked)rep A_Stked Stked (替换原数据is3)save is3,replace clear 清除合并 use bs3

duplicates report A_Stkcd year 报告重复的变量(两个) 显示(surplus为多余的)

copies | observations surplus ----------+--------------------------- 1 | 17017 0 21 | 21 20 22 | 110 105 23 | 46 44 --------------------------------------

duplicates drop A_Stkcd year,force 同一公司同一年数据删掉,强制删除 save bs4

(is, bs都除重就可以合并了)

keep if _merge==3(3为完全匹配,1,2不完全匹配) drop if _merge!=3 如果不完全匹配去除 . save bsis

-------------------------- 300创业板(最小) 002中小板 000主板

keep if substr( A_Stkcd,1,3)==\筛选,substr()为取字符串函数,从第一位开始取取3位,加引号为字符型

summerize Totass 看Totass的各种指标,标准差,最大最小值 su Totass,detail 可以看到上下四分位 截尾,去掉两端1%左右的值

缩尾,将99%以后的数值以99%的数值替代,去除极端值,1%一下同理 su Totlia,d(etail)

su Accrecv-pright 逐个显示变量的信息

corr(elation) Totass Totlia 相关性分析,0.3一下不相关,0.3-0.5低度相关,0.5-0.8中度相关

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4