统计与定量分析实训报告
10公共事业管理1 2010644126 陈忠洲
实验一:数学改革后学生有了更多的选课自由,但学院领导在安排课程上也面临新的问题。例如,MBA研究生班的学生选课学年之间的变化常常很大,去年的学生很多人选会计课,而今年的学生很多人选市场营销课。由于事先无法确定究竟有多少学生选各门课程,所以无法有效地进行教学资源的准备,有人提出学生所选课程与其本科学专业有关,为此,学院领导对学生本科所学专业和MBA三门课程的选修课程情况做了统计,得出如下结果:
本科专业 会计 专业一 专业二 专业三 其他专业 要求:
(1) 以0.05的显著性水平检验学生本科所学专业是否影响其读MBA期间所选课程。 (2) 计算P值。
题目分析:关于第一问,应该先设Ho:学生本科所学专业不影响其读MBA期间所选课程,H1学生本科所学专业影响其读MBA期间所选课程。
这里关键是算出期望值,由于期望值计算需要算出每一行每一列的数据的合计,比如第一行合计为60(即专业一选课人数),用60/152作为专业一选课人数比例的估计值。第一列,选会计的人数合计为61,用61/152作为选会计人数比例的估计值。根据期望值计算公式 fe=RT/n*CT/n*n=RT*CT/n,可以算出第一行和第一列的期望值为24.07895,其他的期望值也同理。最后用X2检验的公式求出本题的结果,再与α=0.05的显著性水平检验做比较,即可得出第一问的答案。
关于第二问,算p值,在第一问的结果基础上,用excel函数的“CHITEST”根据要求就可算出,计算p值的步骤:
用Excel 计算P值,具体步骤是:
(1)将观察值输入一列,将期望值输入一列。 (2)选择【插入】下拉菜单。 (3)选择【函数】选项。
(4)在函数分类中选“统计”,在函数名称中选“CHITEST”,点击【确定】。
(5)在对话框【Actual_range】中输入观察数据。在【Expected_range】中输入期望数据。 结果:
(1)原始数据:
31 8 12 10 MBA所选课程 统计 13 16 10 5 市场营销 16 7 17 7
4*3列联表期望值 行 1 1 1 2 2 2 3 3 3 4 4 4 列 1 2 3 1 2 3 1 2 3 1 2 3 fo 31 13 16 8 16 7 12 10 17 10 5 7 fe 24.07895 17.36842 18.55263 12.44079 8.973684 9.585526 15.65132 11.28947 12.05921 8.828947 6.368421 6.802632 fo-fe 6.921053 -4.36842 -2.55263 -4.44079 7.026316 -2.58553 -3.65132 -1.28947 4.940789 1.171053 -1.36842 0.197368 (fo-fe)2 47.90097 19.0831 6.515928 19.72061 49.36911 6.684946 13.33211 1.662742 24.4114 1.371364 1.872576 0.038954 (fo-fe)2/fe 1.98933 1.098724 0.351213 1.585158 5.501543 0.6974 0.85182 0.147283 2.024295 0.155326 0.294041 0.005726 14.70186 χ2=14.70186 χ2自由度为(4-1)*(3-1)=6 χ2(6)=11.0705 因为χ2>χ2(6),所以拒绝Ho,接受H1,即学生本科所学专业影响其读MBA期间所选课程。 (2)
专业一 专业二 专业三 其他专业 专业一 专业二 专业三 其他专业 P=
结果分析:本题目中一二问中所求的结果都是为了验证学生本科所学专业是否影响其读MBA期间所选课程第二问中P值=0.023<α,所以也是拒绝原假设Ho,所求的结果也一致,也是说明学生本科所学专业影响其读MBA期间所选的课程。
会计 会计 31 8 12 10 统计 13 16 10 5 期望值表 统计 市场营销 市场营销 16 7 17 7 24.07894737 17.36842 18.55263 12.44078947 8.973684 9.585526 15.65131579 11.28947 12.05921 8.828947368 6.368421 6.802632 0.02270674 实验二:某家电制造公司准备购进一批5#电池,现有A,B,C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(单位:h)数据如下:
实验号 电池生产企业 A 1 2 3 4 5 50 50 43 40 39 B 32 28 30 34 26 C 45 42 38 48 40 试分析3个企业生产的电池的平均寿命之间有无显著差异(α=0.05)。
题目分析:关于本题问的是3个企业生产的电池的平均寿命之间有无显著差异,应该利用方差分析中的单因素方差分析来解决。 应该假设:
Ho: 3个企业生产的电池的平均寿命之间无显著差异 H1: 3个企业生产的电池的平均寿命之间有显著差异
接着构建检验的统计量,计算个样本的均值,全部观测值的总均值和各误差平方和,最后计算统计量(用EXCEL数据分析计算出来这些值),得出方差分析表,最后可用F分布或者P值都可以比较出来结果。 结果: 原始数据:
方差分析:单因素方差分析 SUMMARY
组 列 1 列 2 列 3
观测数
5 5 5
求和 222 150 213
平均 44.4 30 42.6
方差 28.3 10 15.8
方差分析 差异源 组间 组内 总计
832 SS 615.6 216.4
df 2 12
14
MS 307.8 18.03333
F 17.06839
P-value 0.00031
F crit 3.885294
从方差分析表中可以看出,由于F=17.06>F0.05(2,12)=4.103,P=0.00031<α,所以拒绝原假设Ho,即3个企业生产的电池的平均寿命之间有显著差异。
结果分析:表中的“SUMMARY”部分是有关于各样本的一些描述统计量,它可以作为方差分析参考信息。“方差分析”部分即为方差分析表,即需要计算的统计量,用F分布或者P-value与α比较都可以得出3个企业生产的电池的平均寿命之间是否有显著差异。
实验三:某百货公司为扩大业务量和知名度,欲将其超市业务覆盖(服务)整个城区。为实现这一目标,首先是要在市区内增建一些超级市场,公司收集了尚未覆盖到的居民区信息(编号为1.2,…,12)和可以建超级市场的商店候选地址(编号为A,B,…,H),以及每个超级市场可以覆盖的居民区的数据资料,如表8-14所示,公司在每个候选地址设立商店的建设成本也估计出来并列在表8—14中。问:应在哪些候选地址建店才能使每个居民区都被覆盖到,又能使总的建设成本最低?用0—1整数规划来建模并应用LINGO或Excel求解。 候选地址编号 候选地址可以覆盖的居民区 建设成本(百万元) A B C D E F G H 1,2,3,7,8 1,5,7,9 2,8,9,12 1,3,6 3,4,10,11 4,5,9,12 5,6,11 7,10,12 8 6 6.5 7 4 9 7.3 6.2 问题分析:本题是属于0—1整数规划的问题,需要引入0—1整数变量才能够解决,关于选址问题,商店候选地址在每个居民点都需要覆盖到,因此需要设Xi代表是否在候选地址(A,…,H)上建设商店。即是:
Xi=0时代表不再i处建设商店,Xi=1代表在i处建设商店(i=A,…,H),目标函数是使建设成本最低,所以模型有:
minZ=8Xa+6Xb+6.5Xc+7Xd+4Xe+9Xf+7.3Xg+6.2Xh Xa+Xb+Xd>=1 Xa+Xc>=1 Xa+Xd+Xe>=1 Xe+Xf>=1 Xb+Xf+Xg>=1 Xd+Xg>=1 Xa+Xb+Xh>=1 Xa+Xc>=1 Xb+Xc+Xf>=1 Xe+Xh>=1 Xe+Xg>=1 Xc+Xf+Xh>=1 Xi为0—1整数变量(i=A,…,H).
利用excel求解,其中重要的步骤是在规划求解中的添加约束一项中需要引入整数变量。具体步骤:
1. 将有关数据录入到电子表格中。
2. 分别对总利润和实际用时的那一列用“sumproduct”进行计算。选择【插入】下拉菜单。
选择【函数】选项。在函数分类中选“统计”,在函数名称中选“sumproduct”,点击【确定】。
3. 然后在【工具】中选择“规划求解”,首先打开“添加约束”对话框中“单元格引用位