改颜色edit-preference-general prefernce-classic
下面命令框-右键-font-改字号
命令cd d:\\ 改到d盘(change directory) dir查询d盘有什么
sysuse auto 系统自带汽车数据,数据变量(字段)显示在右上角 br(owse) 浏览数据(字符型红色,数值型黑色,蓝色-右键-value labels-hide all labels标签隐藏)
h(elp) li(st) 告诉你命令怎么用,下面有例子 左边双击执行,单击复制到命令框 order price mpg(单击右边的变量)
order make-foreign 改变变量顺序,从make到foreign
g(enerate) new=rep78-trunk 输出新变量(rep78,trunk是字段,可单击选择,\表示缺省,加减乘除+-*/)
list if new==14 (==为等于,=为赋值,可以点击more) li(st) if new2>=14 & new2<24 (按q可以退出,即quit) replace new3=rep78 (输错了替换) drop new new2 new3删除变量 list if new>10000
list make if new<10000|new>2000 (竖线表示或者,回车上面那个) !=表示不等于
左边命令,右键save
save data 文件名为data sysuse auto preserve reserve
save auto2 保存时不需加后缀,删除时带后缀.dta sort price从小到大
gsort price 都可以,比较随意
gsort -trunk price (默认加号,为排序) order make new (将new排到第二位) aorder (alphabetic 按字母顺序排序) disp(lay) sin(1) 作为计算器使用 ln以e为底
----------------3.13--------- 锐思数据库选择数据
-----非金融行业负债表---- 左边-财务报表-非金融行业 合并标识-1合并报表 调整标识-1
报表类型-q4、信息来源-q4 公司类别-20-定期报告 信息来源:q4 a股股票代码
截止日期
流动资产合计 应收账款 总资产
流动负债合计 负债合计
所有者权益合计
------非金融行业利润表--- 前同 净利润 营业收入
excel输出(默认)选择列表签+列名 ------打开STATA------
file-import-xls菜单引入文件 clear可清除数据
varible name 不识别中文
选中第一个import first row as varible names
第二个import all data as strings意思是将数据看作字符型(不选) br(ouse)展示数据
流动比率=流动资产/流动负债 资产负债率=总负债/总资产
产权比率=总负债/所有者权益合计 mkdir d:\\hsy1\\mydata 建立文件夹 cd d:\\hsy1\\mydata 基于文件夹 dir 显示文件夹
save bs 保存数据,名为bs
直接运行是双击,显示在框内为单击
g(enerate) currrate=Totcurass/Tutcurlia 流动比率(等号后面点右上方variables) 显示(8 missing values generated)有八个缺失值 g lev=Totlia/Totass 负债率leverage
g pright= Totlia/ TotSHE 产权比率porperty save bs2 另存数据 drop 为删除变量
clear从内存删掉,不会从硬盘删掉 ------利润表----- import save is
g incorate= Netprf/ Incmope 利润率=净利润/营业利润 save is2 ---- clear
use bs2 打开bs2
g year=year( EndDt) 。year(EndDt)表示从变量EndDt里把年份取出,如month() g month=month( EndDt) save bs3
----- clear . use is2
. g year=year( EndDt) . g month=month( EndDt) . save is3
----合并merge横向1对1合并,append纵向合并---
merge 1:1 A_Stkcd year using bs3注意后面的两个变量名字在原来两个表里是相同的,将bs3合并到现在(is3)中 错误类型variables A_Stkcd year do not uniquely identify observations in the master data
而master data指主数据库,using data 从数据库 (替换变量名Stked 改成A_Stked)rep A_Stked Stked (替换原数据is3)save is3,replace clear 清除合并 use bs3
duplicates report A_Stkcd year 报告重复的变量(两个) 显示(surplus为多余的)
copies | observations surplus ----------+--------------------------- 1 | 17017 0 21 | 21 20 22 | 110 105 23 | 46 44 --------------------------------------
duplicates drop A_Stkcd year,force 同一公司同一年数据删掉,强制删除 save bs4
(is, bs都除重就可以合并了)
keep if _merge==3(3为完全匹配,1,2不完全匹配) drop if _merge!=3 如果不完全匹配去除 . save bsis
-------------------------- 300创业板(最小) 002中小板 000主板
keep if substr( A_Stkcd,1,3)==\筛选,substr()为取字符串函数,从第一位开始取取3位,加引号为字符型
summerize Totass 看Totass的各种指标,标准差,最大最小值 su Totass,detail 可以看到上下四分位 截尾,去掉两端1%左右的值
缩尾,将99%以后的数值以99%的数值替代,去除极端值,1%一下同理 su Totlia,d(etail)
su Accrecv-pright 逐个显示变量的信息
corr(elation) Totass Totlia 相关性分析,0.3一下不相关,0.3-0.5低度相关,0.5-0.8中度相关