sas笔记

2019-01-19 15:48

一、基本操作

Editor窗口 打开sas程序 (扩展名*.sas) Log窗口 Output窗口 Explorer窗口 Results窗口 蓝色 绿色 Set Merge

If (if。。。thendelete) Drop(keep)

二、描述性统计

1. Proc Format

value height 0-50=‘<50’ 50-60=‘50-60’ 60-high=‘>60’ 2. Proc freq data=名字 order=freq

Tables 列表变量名/out=数据集名 norow nocol nopercent(table y*x) Format

Label weight=‘高度’ By 变量

3. Proc univariate data=名字 Var 分析变量

Histogram 变量/midpoints=7 to 29 by 2 4. Proc mens

5. Proc gchart

Vbar竖直或hbar 横向 Vbar math / group=sex

Pie sex/type=percent(以百分数显示) Block math/group=sex 图形关键字 Block Hbar

绘制的图形类型 方块图 水平的条形图

图形关键字 pie pie3d

绘制的图形类型 饼形图 三维饼形图

hbar3d Vbar vbar3d

6.Proc gplot Plot x*y

Symbol value=star color=red 选项 Value = 符号 Color = 颜色 CV =颜色 H = n<单位> POINTLABEL i = 连线方式 CI = 颜色 L = n Width = n

意义

水平的三维条形图 donut 竖立的条形图 竖立的三维条形图

star

环形图 星形图

取值

plus, x, star, square, diamond, triangle, hash, y, z, paw, point, dot, circle

black, red, green, blue, cyan,magenta, gray, pink, orange, brown, yellow

单位有:cell, cm, pct, pt, in

none, join, spline, needle

0 – 空白线,1 - 实线,2 – 虚线

表示点使用的符号 表示点的符号及连线的颜色

专指点的符号的颜色

指名符号的大小 在点的附近表明Y轴变量的值 指明连线的方式 专指连线的颜色 n为线型的序号 n表示线的宽度

7.proc g3d data=名字 曲面图 Plot x*y=z

8.proc gcontour data= 曲面图对应的等高线图 Plot x*y=z/nolegend autolabel

三、T检验 >0.05 接受H0(差异有统计学意义)

用于检验两个样本总体均数是否相等 独立的,来自正态分布的总体 定量资料

对于两组独立样本的定量资料,要求方差相等,两组资料来自正态总体 用proc univariate Proc means

Proc ttest(能提供基本统计量的计算,对单样本资料、配对设计资料和两独立样本进行t

检验)

第一步,正态性检验 proc univariate normal (夏皮洛威尔克) Var 分析变量

Freq 频数变量(频数分布资料时用)

Class 分类变量(两组独立资料时用)

第二步,proc ttest h0=30(已知的总体均数为30)

Var 分析变量( paired x1*x2 配对设计资料时用,检验两组均值是否一致)

Freq 频数变量(频数分布资料时用)

Class 分类变量(两组独立资料时用)

四、方差分析

变异来源 总变异 组间

自由度 N-1 k-1

SS

2(x?x)??iji?1j?1kniMS

F

2n(x?x)?ii i?1kSS组间k?1SS组内N—k

MS组间MS组内

组内

N-k SS总—SS组间 适用于多个样本均数的比较,资料独立,正态,各总体方差相等 方差分析可用于分析主效应,交互效应

方差分析方法:完全随机设计方差分析(单因素方差分析)

随机区组方差分析(双因素方差分析,无需方差齐性检验) 析因方差分析 重复测量方差分析

使用 proc anova(各样本数一样)和proc glm(generalized linear model) 第一步,正态检验 proc univariate normal Var class 第二步, proc glm

Class g 分类变量 (分类变量即自变量,必须为离散型变量) Model x=g(因变量=自变量或自变量之间的交互效应)效应模型, Means g/hovtest snk

(means 列出比较组的均数和标准差)

(hovtest各比较组的方差齐性检验,homogeneity of variance test,默认levene)

(snk 进行均数间的多重比较 student Newman keuls)

Lsmeans a*b/tdiff(析因设计资料时用,列出变量或交互效应各水平的均值)

(tdiff 表示对变量各水平均值或交互效应各水平均值进行两两比较的t检验)

1与2、3、4有差别 2与1、4有差别 3与1、4有差别 4与1、2、3有差别

第三步,多重比较

五、卡方检验

卡方检验是检验观测值的频率分布与理论分布是否吻合的一种统计方法 用法有卡方拟合优度检验(根据样本的频率分布检验总体分布是否吻合假定的分布,两个率

或两个构成比比较的卡方检验)

卡方独立性检验(一份随机样本按两种属性分类,其个体来自第一个变量某类别的概

率与来自第二个变量某类别的概率是否独立)

Proc freq可进行列联表资料的卡方检验

Weight 权重变量(使每个量初始权重为1)

Tables 行变量*列变量/expected chisq nocol norow nopercent (exact 表示用fisher’s确切概率法,理论频数小于5)

Testp(0.1667,0.1667,0.1667,0.1667) (expected输出各个格子的理论频数) (chisq 进行卡方统计量的计算)

N>=40 T>5 普通卡方检验 T为理论频数(行*列/总) N>=40 1<=T<5 校正卡方检验

N<40 T<1 fisher’s确切概率法

卡方:卡方拟合优度检验 df=(k-1)/(k-r-1) 列联表独立性检验(2X2 2Xc rX2 rXc) 配对设计资料的卡方检验 ( table r*c/agree )

六、基于秩次的非参数统计

参数统计方法(t检验、方差分析)

对总体分布的参数进行估计或检验 非参数统计方法

不需要对总体分布形状做出任何假定,适用于总体不正态分布、分布未知、正态分布但方差不齐性、分析等级资料

SAS过程:

单样本、配对资料 prco univariate中的signed rank 符号秩和检验(服从正态,t检验) 完全随机设计两样本

两独立样本 proc npar1way中的wilcoxon (exact确切概率法,适用于样本量较少) 完全随机设计多样本(单因素) proc npar1way中的kruskal-wallis

随机区组设计(双因素)proc rank(计算秩得分)再proc glm(分析秩次) Exact

在两样本量相同时,sas以秩和较大者作为统计量进行概率值的计算 在两样本量不同时,sas以较小者的秩和进行概率值的计算

Z includes a continuity correction of 0.5

统计量包含了一个0.5的连续校正多个样本

Average scores were used for ties 在系列计算中使用了平均得分

先用exact test,后用Z(n>50)


sas笔记.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:苏教版小学语文四年级上册《九寨沟》教学反思

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: