Stata语句1 1.reg y x1 x2 predict xxx predict newvar, stdp predict aaa,re predict newvar, stdr predict newvar, xb 量的预测值。
predict newvar, residual test x1
值为回归报告中t值平方。test x1=x2 test x1*a=x2*b 系。
2.tab x1,gen(x1) gen fsize1=fize==1 则为零。下同。 gen fsize2=fsize==2 gen fsize3=fsize==3 gen fsize4=fsize==4 gen fsize5=fsize>=5 3.reg y x1 x2 x3,level(99) 返回先前回归中因变量的拟合值,xxx随意变量名。 预测拟合值的标准差
返回先前回归中因变量的残差, aaa为随意变量名。 预测残差的标准差
产生一个新变量其值为由上面回归方程计算的被解释变
产生一个新变量其值为由上面回归方程计算出的残差 检验变量x1的显著性,返回当X1系数为零时的F值,F检验x1 x2变量的系数是否相等。
a,b为任意常数,检验变量x1与x2是否存在某种线性关产生x1的虚拟变量。
产生虚拟变量,如果family size为1,则令fsize1=1,否返回回归报告中99%的置信区间。
set level 97 reg y x1 x2 x3,noconstant 4.display fprob(q, n-k-1, F) 值
di tprob(n-k-1,t) 5.stata中缺失值为无穷大值。
在以后的回归中都默认返回97的置信区间。 无常数回归。
返回值为F,分子自由度为q,分母自由度为n-k-1的p
返回值为t,自由度为n-k-1的p值
reg bwght cigs parity faminc if fatheduc<. & motheduc<.
6.标准化变量
egenstdprice=std(price) std(0)/
reg y x1 x2 x3,beta
7. 将回归结果输入到test.doc regbwght cigs faminc
outreg2 using test.doc, nolabel replace regbwghtlbs cigs faminc
outreg2 using test.doc, nolabel append regbwght packs faminc
outreg2 using test.doc, nolabel append 8.逻辑表达式: 缺失值用“.”表示
/可以添加语句:egenstdprice=std(price) ,mean(0)
关系运算符:==,!=(不等于),~=(约等于),>,<,<=,>= 逻辑运算符:&(与),|(或),~(非) 9.对现有变量重新赋值
replace oldvar =exp [if] [in] [, nopromote]
10.describe:报告样本容量、变量个数、变量名称等 11.sort x1 x2 依次按升序排列 gsort -x1 按x1降序排列 12.excle转为stata时日期变量的处理
gen date(或任一新变量名)=date(‘原变量名’,‘YMD’/'DMY'/..) form date %td
12. 删掉重复记录 duplicates drop 13.独立样本均值差异检验 ttest
Stata语句2
* Introduction to Stata
log using stata_fall.txt, text replace
*使用日志(log)。它可以帮助我们记录stata的运行结果 clear all set more off
*关闭more选项。如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。你按空
格键后再输出下一屏,直到全部输完。如果关闭则中间不停,一次全部输出
*cd D:/undergraECMT/data *进入数据所在的盘符和文件夹 log using (文件名).log,replace
*打开日志文件,并更新。日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果 use http://www.ats.ucla.edu/stat/data/hs0, clear *打开数据文件 *
*insheet using intro_hs0.csv, clear *
*use intro_hs0, clear
*Summarizing the data describe
*可以告诉我们每一个变量的含义
*具体了解每一个变量的特征,我们可以用 tabstat 命令。例如我们可以计算 wage 的均值,方差,中位数,范围,具体可以用 help tabstata 查询。
tabstat wage, stats(mean)
tabstat wage, stats (sd median range) *算 wage 的均值,方差,中位数,范围
tabstat wage, by (educ) stats(mean) *不同教育水平的工资的均值
summarize
*总计全体,Summarize(Sum)将汇报数据的均值和方差等信息。 summarize wage *有关工资的均值与方差
*如果需要更详尽的信息,可以进一步使用后缀detail
histogram wage *画柱状图
scatter wage educ
*画出两个变量之间的分布关系
graph twoway scatter wage educ
*直观的看到教育水平变化时工资的变化,可以用 “scatter” 命令或者 “graph twoway scatter” 命令