24 19 1100~1300 10 3 1300~1500 60 60 合计 (1) 请用直方图直观地比较这两个样本,你能得到什么结论? (2) 你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命的一般水平?请简要说
明理由。 (3) 哪个供应商的灯泡具有更长的寿命? (4) 哪个供应商的灯泡寿命更稳定?
四. (20分)为估计每个网络用户每天上网的平均时间是多少,随机抽取了225个网络用户的简单随机样本,
得样本均值为6.5小时,样本标准差为2.5小时。
(1)试以95%的置信水平,建立网络用户每天平均上网时间的区间估计。
(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,建立年龄在20岁以下的网络用户比例的置信区间?
(注:z0.025?1.96,z0.05?1.645)
五. (20分)一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行使时
间(小时)行驶的里程(公里)之间的关系,为此随机调查了20个出租车司机,根据每天的收入(y)、行使时间(x1)和行驶的里程(x2)的有关数据进行回归,得到下面的有关结果(??0.05):
??42.38 方程的截距?0??9.16 回归系数?1??0.46 回归系数?2截距的标准差s??0?36.59 1回归平方和SSR?29882 残差平方和SSE?5205 — 回归系数的标准差s????4.78 回归系数的标准差s??2?0.14 (1) 写出每天的收入(y)与行使时间(x1)和行驶的里程(x2)的线性回归方程。
(2) 解释各回归系数的实际意义。 (3) 计算多重判定系数R,并说明它的实际意义。 (4) 计算估计标准误差Sy,并说明它的实际意义。
(5) 若显著性水平?=0.05,回归方程的线性关系是否显著?(注:F0.05(2,17)?3.59)
2模拟试题二解答
一、单项选择题
1. A;2. A;3. C;4. A;5. C;6. A;7. D;8. C;9. B;10. D。
二、简要回答下列问题
1. (1)条形图是用条形的长度或高度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
(2)直方图的各矩形通常是连续排列,而条形图则是分开排列。
(3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 2. 从均值为?、方差为?的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n?30),样本均值x的抽样分布近似服从均值为?、方差为?22n的正态分布。
3.(1)从一组样本数据出发,确定出变量之间的数学关系式;(2)对这些关系式的可信程度进行各种
6
统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;(3)利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。
4. 在计算一组商品价格的综合指数时,把作为权数的销售量固定在基期计算的指数称为拉氏价格指数。在计算一组商品价格的综合指数时,把作为权数的销售量固定在报告期计算的指数称为帕氏价格指数。
三、(1)两个供应商灯泡使用寿命的直方图如下:
304030频数20频数20100700~900900~11001100~1300101100~13001300~15001300~15000700~900900~1100使用寿命使用寿命
从集中程度来看,供应商甲的灯泡的使用寿命多数集中在1100小时~1300小时之间,供应商乙的灯泡的使用寿命多数集中在900小时~1100小时之间。从离散程度来看,供应商甲的灯泡的使用的离散程度大于供应商乙的离散程度。
(2)应该采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平,因为两个供应商灯泡使用寿命的分布基本上是对称分布的。
(3)计算两个供应商灯泡使用寿命的平均数如下:
供应商甲供应商乙x甲??Mi?1kkifi?n800?12?1000?14?1200?24?1400?1066400??1106.67小时。
6060800?4?1000?34?1200?19?1400?364200??1070小时。
6060x乙??Mi?1ifi?n甲供应商灯泡使用寿命更长。
(4)计算两个供应商灯泡使用寿命的标准差和离散系数如下:
n?1s甲199.89v甲???0.18
x甲1106.67s甲??(Mi?1ki?x)2fi?2357333.34?199.89小时。
59n?1s136.92v乙?乙??0.13
x乙1070由于v乙?v甲,说明供应商乙的灯泡寿命更稳定。
s甲??(Mi?1ki?x)2fi?1106000?136.92小时。 59
四、(1)已知:n?225,x?6.5,s?2.5,z0.025?1.96。
7
网络用户每天平均上网时间的95%的置信区间为:
x?z?2sn?6.5?1.96?2.5225?6.5?0.33
即(6.17,6.83)。 (2)样本比例p?p?z?2
90?0.4。龄在20岁以下的网络用户比例的95%的置信区间为: 225p(1?p)0.4?(1?0.4)?0.4?1.96??0.4?0.064 n225即(33.6%,46.4%)。
??42.38?9.16x1?0.46x2。 五、(1)回归方程为:y??9.16表示:在行驶里程不变的情况下,行驶时间每增加1小时,每天的收入平均增 (2)?1??0.46表示:在行驶时间不变的情况下,行驶里程每增加1公里,每天的收入平均增加加9.16元;?20.46元。
(3)R?2SSR29882??85.17%。 SST29882?5205表明在每天收入的总变差中,被估计的多元线性回归方程所解释的比例为85.17%,说明回归方程的拟合程度较高。
(4)se?SSE5205??17.50。
n?k?120?2?1表明用行驶时间和行驶里程来预测每天的收入时,平均的预测误差为17.50元。
(5)提出假设:H0:?1??2?0,H1:?1,?2至少有一个不等于0。 计算检验的统计量F:
SSRk298822??48.80
SSEn?k?1520520?2?1于F?48.80?F0.05(2,17)?3.59,拒绝原假设H0。这意味着每天收入与行驶时间和行驶里程之
F?间的线性关系是显著的。
8