SAS学习(3)

2019-01-26 15:35

直方图的每一个条形代表了绘图变量(HEIGHT)在一个区间的取值情况,比如70到75之间的条形代表身高在70到75英寸的人,条形高度为组频数,即取值在这一区间的观测个数,可以看出这一组有一个学生。单击这一条形选中在此范围的观测,可以发现这时数据窗口的相应观测也被选定了,被选中的是Philip,身高72英寸。如果双击某一条形,比如60到65的条形,就可以在选定相应观测的同时弹出一个检查观测窗口,窗口中显示各被选中的观测序号,以及其中一个观测的各变量值。这样可以很方便地检查图中各部分所对应的观测。为取消选定,只要在图中空白处单击即可。

作出的图形有一个方框包围。如果想改变图形大小,可以单击方框使其变粗,然后拖动四个角中的一个,就可以把图形放大或缩小。甚至还可以把一个角向其对角方向拖动一直拖过对角,这样可以改变图形的横纵轴方向。拖动边框可以把图形移动到窗口内其它位置。

图形中提供了一个设置菜单,可以单击图形边框角上的向右箭头或在图形内右键单击来打开。菜单内容包括Ticks,可以设置坐标轴的具体画法;Axes用来指定画不画坐标轴;Observations 用来指定是否画观测;Values指定是否标出各条形高度值。

对连续数据(Int型)作直方图可以反映其分布情况,对离散数据(Nom型)作直方图同样可以反映其分布,即取每一个离散值的比例大小(频数分布)。比如,在作了身高的直方图后,选定变量SEX,对其作直方图,则结果打开一个新图形窗口作出只有两个条形的条形图,一个标记为F,另一个标记为M,高度分别为9和10,即有9个女生,10个男生,男女比例为10 :9。单击标F的条形,可以看到数据窗口中所有女生的观测被选定,另外还可以看到已作的身高的直方图也发生了变换,身高的每一个条形都分成了颜色不同的两部分,其中下面的一部分代表女生。

在用Analyse菜单中的作图命令作图时如果没有选定的变量则弹出一个对话框提问用哪一个变量作图,如果对身高作图,只要选HEIGHT然后按Y钮即可。

盒形图是另一种表现数值型变量分布的图形。比如,要画身高分布的盒形图,选定变量HEIGHT然后用“Analyse | Box Plot/Mosaic Plot”可以作出图 12。

从图形菜单中选Values 可以标出图中重要数据值。可以看出,此盒形图的横轴没有用处,纵轴代表身高的取值范围。盒形的中间有一条粗线,这是身高分布的中位数的位置,盒子上边线是分布的四分之三分位数,下边线是分布的四分之一分位数,盒子上下边线包含了分布的中间50%的观测。盒子的长度叫做分布的四分位间距,其作用类似于标准差,可以反映数据分布的分散程度。从盒子边线向外画了两条线叫做触须线,最长可以延伸到四分位间距的1.5倍,但是如果已经到了数据的最小值或最大值处就不再延伸。如果触须线没有达到数据的极端值,则这些数据点用触须线以外的点来画出,一般认为这样的点是异常点。从盒形图可以看出数据的偏斜情况,比如我们看到盒子的下半部比上半部长,而且下触须线比上触须线长,说明身高分布略左偏。

用盒形图菜单中的“Means”选项可以在盒形图上加画一个菱形,菱形的中间代表分布的平均值,菱形端点到中间距离为两倍标准差。如果是变量服从正态分布,菱形上下端点之间应该包含大约95%的观测。平均值和中位数的比较也能反映变量的偏斜情况,平均值低于中位数可能左偏。

单击或双击盒形图的某一部分(盒子上半部或下半部、触须线、极端值)可以选定观测。

盒形图可以方便地比较按某分组变量分组后的分布情况。比如,如果我们想看一看男女的身高分布有何异同,不选任何变量启动“Analyze | Box Plot/Mosaic Plot”菜单,弹出选择变量的对话框如图 13。

选身高为Y变量,选性别为X变量,画出的图见图 14。

图中有两个盒形图,女生一个,男生一个。从图中看出,男生身高普遍高于女生,且女生身高分布左偏较男生严重。这种并排盒形图可以十分直观地比较两个相关的分布。作盒形图时指定多个Y变量也可以作出并排的盒形图,比如,同时指定身高和体重作为Y变量作盒形图就可以生成身高和体重的并排的盒形图。 Analyze菜单的“Box Plot/Mosaic Plot”命令对连续型变量作盒形图,对离散型变量将作 马赛克图。比如,对性别变量作图得图 16。

选“Values”菜单后标出了男女的人数、百分比。马赛克图一般不对单个变量作,而是对两个离散变量来作。比如,先把SASUSER.CLASS 中变量AGE的量测水平由Int改为Nom,然后取消所有变量的选定,启动“Box Plot/Mosai Plot ”,选SEX为Y变量,选AGE为X变量,作图如图 15。

这种图的好处是直观显示了两个变量每种取值组合的观测个数和比例。单击或双击其中一个方块可以迅速选中一个分组,比如双击年龄为11性别为女(F)的方块可以看到这一组的学生。

数据探索――二维

SAS/INSIGHT可以作曲线图、散点图、散点图矩阵,可以在散点图中刷亮观测。

曲线图有一个取值由小到大的X变量,有一个或几个Y变量,以X变量为横坐标对Y 变量画曲线。为了演示曲线图,打开SASUSER.AIR数据集(用“File | Open”菜单)。这个数据集是德国某城市一周的每小时记录的空气污染情况。变量DATETIME是记录的日期时间,为特殊SAS格式数据,变量DAY为星期几,HOUR为几点钟,CO、O3、SO2、NO、DUST分别为一氧化碳、臭氧、二氧化硫、一氧化氮、粉尘的浓度,WIND为风速。要画一氧化碳的曲线图,可以在未选任何变量的情况下用“Analyse | Line Plot”,弹出变量对话框(图 17)。

选DATETIME 为X变量,CO为Y变量,可以画出CO的时间序列曲线图。

单击曲线上某一个点可以显示其观测序号,双击可以检查观测。如果想单击曲线上点时不显示观测序号而显示记录时间是几点,可以在曲线图窗口中选主菜单的“Edit | Window | Renew”,可以再弹出变量窗口,选HOUR 并按Label钮把时间指定为标签变量。这时在作的CO的曲线图上单击一个点显示的就是记录时间了。可以看出CO的高峰一般在早晨8点和晚上17点-21点。用图形菜单(右键或单击向右三角)中的Observations可以画出各个数据点的符号。

可以在图上同时画出多条曲线。比如,想考察风速对污染的影响,在图形窗口中再用主菜单的“Edit | Window | Renew”,把WIND也作为Y变量,画出的图就有两条不同颜色的曲线,单击外面的CO变量符号和WIND变量符号可以加重显示对应的曲线以区分这两条曲线。见图 18 。图中被选的点是风速的最高值,时间是11

点。注意在一条曲线中被选在另一条曲线中也被选。从此图可以看出风速对污染有较明显的影响,风大时污染较轻。

散点图也有一个X变量和一个Y变量,但不要求X变量有从小到大的次序,画图不用连线而是用散点画出每一对X、Y坐标。比如对SASUSER.CLASS,我们希望通过画图了解身高和体重的关系。在数据窗口中先选定体重(Y轴变量)再附加选定身高(X轴变量),启动菜单 “Analyze | Scatter Plot”,就可以生成以体重为纵轴以身高为横轴的散点图(见图 19)。

从图可以看出体重与身高有明显的线性相关关系。

为了解哪一个点代表哪一个学生,单击一个点可以显示其观测序号,双击可以检查观测。为了在单击时可以显示学生名字而不是观测序号,需要把NAME指定为标签变量。这可以在生成散点图时先不在数据窗口选X、Y变量而是直接启动“Analyze | Scatter Plot”菜单,弹出变量对话框,在其中选X、Y变量并把NAME指定为Label变量。这时,单击散点图中最左下角的那个点可以显示名字Sandy,单击最右上角的那个点可以显示Philip。选多个点可以用附加选中的办法(Shift或Ctrl单击)。

为了在散点图中选定多个点,SAS/INSIGHT还提供了一种称为“ 刷亮(Brushing)”的操作。在图中拖动鼠标光标可以拖出一个小长方形,在这个长方形中的点都被选中,称它为刷子。选中的点在数据窗口也被选中,可以在数据窗口翻页查看,或用数据窗口的Find Next菜单命令查看,或在数据窗口用Move to First菜单命令把选中的点移到最前查看。双击长方形(刷子)可以弹出检查观测窗口,在那里可以逐个查看选中的观测内容。

拖动刷子的角可以改变其大小。拖动刷子内部可以移动它的刷亮位置,使进入刷子的点被选中,而离开了刷子的点被取消选中。可以同时用附加选中(Ctrl单击)的办法加选不在刷子内的点,这些点还可以显示标签。在拖动刷子时如果同时按住Shift或Ctrl键则为附加选定,即进入刷子的点被选中而离开刷子的点仍保持被选中。可以按住Shift或Ctrl键拖出第二个刷子,这时第一个刷子不再显示但它刷亮的点仍保持刷亮,移动第二个刷子时如果按住Shift 或Ctrl键仍可保持已有选定。为了取消所有选定,只要点击图内空白处。 散点图矩阵画出多个变量两两间的散点图以考察多变量关系。以SASUSER.CLASS为例,比如说我们想了解年龄、身高、体重间的关系。先把年龄的量测水平设为连续型(Int),在数据窗口选定年龄、身高、体重,可以作出图 20。


SAS学习(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:中小企业成本控制存在的问题及对策

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: