考题卷号:10
一、 (20分)在2008年8月北京举办的第29届奥林匹克运动会上,获得金牌总数前三名的国家及奖牌数如下。要描述这一数据,可以使用的图形有哪些?说明它们在描述这一数据中的用途。 排名 1 2 3 国家 中国 美国 俄罗斯 金 51 36 23 银 21 38 21 铜 28 36 28 总 100 110 72 列出适合展示上述数据的图形并说明这些图形的用途。 (1) 可使用条形图,以国家为项目展示三个国家各种奖牌数的对比情况,或以奖牌种类为项目展示不同国家获得的某种奖牌数量的对比情况。 (2) 可使用环形图,展示三个国家所获得的各种奖牌所占比例,或展示三种奖牌中各国家所获奖牌数目所占比例。 二、 (20分)某企业生产的产品需用纸箱进行包装,按规定供应商提供的纸箱用纸的厚度不应低于5毫米。已知用纸的厚度服从正态分布,?一直稳定在0.5毫米。企业从某供应商提供的纸箱中随机抽查了100个样品,得样本平均厚度x?4.55毫米。 (1) 在??0.05的显著显著性水平上,是否可以接受该批纸箱?该检验中会犯哪类错误?该错误的含义是什么? (2) 抽查的100个样本的平均厚度为多少时可以接收这批纸箱?此时
21
可能会犯哪类?该错误的含义是什么? (注:z0.025?1.96,z0.05?1.645) (1)统计量z=(4.55-5)/(0.5/10)=-9<-1.96,拒绝原假设。 该检验中会犯第一类错误,即原假设是正确的却将其拒绝的错误。 (2)若要接受,则-1.96<(x-5)/(0.5/10)<1.96,即平均厚度在4.902毫米到5.098毫米之间时可以接受这批纸。此时会犯第二类错误,即原假设是错误的却将其接受的错误。 三、 (20分)简要说明?2分布在统计中的的应用。 卡方分布应用很广,常用于假设检验和置信区间的计算,比如应用到独立性检验中,同质性检验、适合性检验等等 四、 (20分)在多元线性回归分析中,如果某个回归系数的t检验不显著,是否就意味着这个自变量与因变量之间的线性回归不显著?为什么?当出现这种情况时应如何处理? (1)在多元线性回归分析中,当t检验表明某个回归系数不显著时,也不能断定这个自变量与因变量之间线性关系就不显著。因为当多个自变量之间彼此显著相关时,就可能造成某个或某些回归系数通不过检验,这种情况称为模型中存在多重共线性。 (2)当模型中存在多重共线性时,应对自变量有所选择。变量选择的方法主要有向前选择、向后剔除和逐步回归等。 22
五、 (20分)下表是某贸易公司近几年的出口额数据: 年份 2002 2003 2004 2005 2006 2007 2008 出口额(万美元) 13 19 24 35 58 88 145 (1) 从图形上判断,出口额时间序列含有什么成分? (2) 要预测该公司的出口额,应采用哪种趋势线?该趋势线的特点是什么? (3) 根据上面的数据拟合的指数曲线方程为:??8.02?(1?0.4904Y)t,这里的0.4909的具体含义是什t么? (1) (2) (3) 含有上升趋势。 应采用上升趋势,它是两个以上的低点的连线。 出口额年增长率。 23
考题卷号:11
一、 (20分)A、B两个班各有50名学生,统计学考试成绩的描述统计量如下: 统计量 平均数 中位数 25%四分位数 75%四分位数 标准差 最小值 最大值 A班 74.4 75 67 80 10.6 44 96 B班 68.5 67 56 83 17.4 35 100 (1) 画出两个班考试成绩的箱线图,并比较分布的特征。 (2) 根据统计量对两个班考试成绩的特点进行分析。 (3) 两个班考试成绩的最低分和最高分是否属于离群点? (1) A班平均成绩较高,成绩分布相对集中,分数极差较小,而B班平均成绩相对较低,成绩分布较为分散,高分与低分差距较大。 (2) A班成绩的平均值和中位数都高于B班,表明A班的整体成绩相对较好,但从最大值和75%分位数来看B班的尖子生要比A班更优秀,同理差生也更差。从标准差、极差、四分位差可以看出B班班内的学生间成绩差距要大于A班。 (3) 都不属于。 二、 (20分)谈谈你对方差分析的理解。 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”, 用于两个及两个以上样本均数差别的显著性检验。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分 24
析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量,其基本思想是通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和。 三、 (20分)某厂产品的优质品率一直保持在40%,近期质检部门来厂抽查,共抽查了50件产品,其中优质品为9件。 (1) 在??0.05的显著显著性水平上,能否认为其优质品率仍保持在40%? (2) 该检验中可能犯哪类错误?其含义是什么? (3) 根据上述检验计算出的P?0.564,解释这个P值的具体含义。 (注:z0.025?1.96,z0.05?1.645) (1) z=(18%-40%)/(18%/√50)=-8.64,拒绝原假设,认为不能保持。 (2) 可能犯第一类错误,即原假设是正确的却将其拒绝的错误。 (3) 当原假设为真时所得到的样本观察结果或更极端结果出现的概率为0.564. ?,xk,则四、 (20分)设因变量为y,k个自变量分别为x1,x2,多元线性回归模型可表示为: 25