4)修改图表区格式调出图表区格式对话框,选择“图案”选项,选中“阴影”和“圆角”,见图.点击“填充效果”按钮,弹出“填充效果”对话框,选择双色,白一青绿从上向下,水平过渡,确定,然后调出“绘图区格式”对话框,其中“边框”和“区域”都选“无”,然后点击“确定”
5)调整坐标轴标记观察图像,发现坐标轴的标识 x 和 y 的位置、字体、大小,方向需要调整,字符 y 是横躺着的,需要转过来.右击坐标轴标记字符,调出“坐标轴标题格式”对话框,如图所示.设置适当的字体、字号,选择“对齐”选项,显示默认对齐方向是 900 ,用鼠标把文本方向转到 00 ,确定.
修饰完成以后的图像见图.图上没有画网格线,如果想加上网格线,可以通过“图表选项”一“网格线”加上网格线,再调出“网格线格式”对话框,设置网格线的线形、粗细和颜色,通常可把网格线的线宽设置细一些,颜色设置浅一些,线形为虚线.
三、总体分布的假设检验
16
(一)?2检验
例9 下表数据来自于CUMCM 1999A题——自动化车床管理,问这批数据服从什么样的分布?
表5 100次刀具故障记录(完成的零件数)
459 612 926 527 775 402 699 447 621 764
362 452 653 552 859 960 634 654 724 558
624 434 164 513 755 885 555 564 531 378
542 982 487 781 649 610 570 339 512 765
509 640 734 474 697 292 84 280 577 666
584 742 608 388 515 837 416 246 496 763
433 565 428 824 628 473 606 687 468 217
748 706 1153 538 954 677 1062 539 499 715
815 593 593 862 771 358 484 790 544 310
505 680 844 659 609 638 120 581 645 851
⒈ 数据分析
将上述数据排成一列,作描述性统计,得结果如图所示:
⒉ 数据分组
⑴ 确定分组数k
考虑数据的跨度1069≈1100,如果分成11组,恰好组距为100,所以取分组数k?11,由此得11个区间为:<150,(150,250], (250,350], (350,450], (450,550], (550,650], (650,750], (750,850], (850,950], (950,1050],>1050。
⑵ 统计各组频数,画直方图
接收 150 250
频率 累积 %
2 2.00% 3 5.00%
17
350 450 550 650 750 850 950 1050 其他
4 9.00% 10 19.00% 20 39.00% 24 63.00% 15 78.00% 12 90.00% 5 95.00% 3 98.00% 2 100.00%
直方图302520151050120.000.00?.00`.00@.00 .00%0.00%频率累积 %频率
从直方图可以看出刀具故障记录数据比较接近正态分布。故假设X服从正态分布,其数学期望的无偏估计为??x?600。对总体方差的估计有两种公式,一种是矩法估计
??S??(Xi?X)/(n?1)。这两???(Xi?X)/n,另外一种是样本方差估计??222i?1i?1n1502503504505506507508509501050其他接收n种估计调用函数STDEVP或STDEV来计算,在弹出的对话框内输入数据所在的区域,可得结果。
⑶ 计算各区间的理论频率
假如原假设XN(?,?2)成立,则X落入区间(ti?1,ti]的理论概率为
?i?P{ti?1?X?ti}?F(ti)?F(ti?1) p这可用NORMDIST函数来计算,该项函数相当于查正态分布表,它有四个参数:x,?,?,1,其中x是分布函数的自变量,?是数学期望,此处用估计值600,?是标准差,采用矩法
?i。 ?i后,再计算各区间理论频数np估计量??195.6436。求得各区间上的理论概率p?i)2(mi?np⑷ 计算统计量???
?npi?1i2k在新列中利用自定义公式加拖动来计算。
18
⑸ 根据?2值作出判断
?i)2(mi?np????inpi?12k式中的r是被估计参数的个数。本例中k?11,?2(k?r?1),
r?2,故?22查表得?0.05该值也可用CHINV(0.05,8)=15.5073?2(8),(8)?15.5073,
得到,由于?2?4.71647,小于临界值,故接受原假设:总体X服从正态分布。
⑹
?2值的另一种计算法
用函数CHITEST,它需要两列数据,一组是各小区间内样本点的个数,另一组是理论
频数。用CHITEST函数时需要两个参数:在Actual_range栏目输入存放各小区间内样本点的个数的数据块的地址索引(如下图中的B2:B12),Expected_range栏目输入第二组数据(理论频数)的直址索引,得到结果是0.90929593。Excel规定的自由度为k?1,即11-1=10.以上结果的含义是:P{?2(10)??2}?0.90929593,由上式可以求出统计量?2的值,方法是用CHINV函数,它需要两个参数,在Probability栏目输入刚才的结果0.90929593(鼠标点一下刚才的结果即可),在Deg_freedom(自由度)栏目内输入10,得到结果4.716468,这就是统计量?2的值,与前面求得的结果相同.
〖注〗本例分组的结果前两个组和最后两个组的数据个数比较少,可以将前两个区间合并成一个区间,将后两个区间也合并成一个区间,此时k?9,检验结果不变。
四、回归分析
⒈一元线性回归
工具→数据分析→回归→确定 19
按要求输完后,点确定即可得回归分析的结果:
结果中的项目比较多,其中“回归统计”中的主要项目解释如下: ⑴ Multiple R:相关系数r,其值越大,越接近1线性关系越显著; ⑵ R Square:即r;
2?。 ⑶ 标准误差:均方差的估计值?方差分析表中的主要项目如下表:
表6 方差分析表的重要项目
回归分析 残差 总计 df(自由度) f回 fe f SS S回 Qe Syy MS S回/ f回 Qe/ fe F F值 20
其中,残差平方和Qe??(yi?1ni2?)2,???bx??a?Qe(n?2)是总体参数的无偏估计。若i2Sxx记Sxx??(xi?x),Syy??(yi?y),Sxy??(xi?x)(yi?y),则Qe?Syy?,
Sxy222令S回?SxxSxy,则Qe?Syy?S回。统计量
F?S回1Qe(n?2)F(1,n?2)
回归结果中的t Stat栏目对应的是统计量t的值,t?Sxy?Sxx?t(n?2),查表,若
t?t?2(n?2)则回归效果显著。
⒉多元线性回归
(略)
21