(1)估计第三个顾客恰好等待4分钟开始办理业务的概率;
(2)X表示至第2分钟末已办理完业务的顾客人数,求X的分布列及数学期望. 解析 设Y表示顾客办理业务所需的时间,用频率估计概率,得Y的分布列如下: Y P 1 0.1 2 0.4 3 0.3 4 0.1 5 0.1 (1)A表示事件“第三个顾客恰好等待4分钟开始办理业务”,则事件A对应三种情形:①第一个顾客办理业务所需的时间为1分钟,且第二个顾客办理业务所需的时间为3分钟;②第一个顾客办理业务所需的时间为3分钟,且第二个顾客办理业务所需的时间为1分钟;③第一个和第二个顾客办理业务所需的时间均为2分钟.
所以P(A)=P(Y=1)P(Y=3)+P(Y=3)P(Y=1)+P(Y=2)P(Y=2)=0.1×0.3+0.3×0.1+0.4×0.4=0.22.
(2)方法一 X所有可能的取值为0,1,2.
X=0对应第一个顾客办理业务所需的时间超过2分钟,
所以P(X=0)=P(Y>2)=0.5;
X=1对应第一个顾客办理业务所需的时间为1分钟且第二个顾客办理业务所需的时间
超过1分钟,或第一个顾客办理业务所需的时间为2分钟,所以P(X=1)=P(Y=1)P(Y>1)+P(Y=2)=0.1×0.9+0.4=0.49;
X=2对应两个顾客办理业务所需的时间均为1分钟,
所以P(X=2)=P(Y=1)P(Y=1)=0.1×0.1=0.01. 所以X的分布列为:
X P 0 0.5 1 0.49 2 0.01 E(X)=0×0.5+1×0.49+2×0.01=0.51. 方法二 X的所有可能取值为0,1,2.
X=0对应第一个顾客办理业务所需的时间超过2分钟,所以P(X=0)=P(Y>2)=0.5; X=2对应两个顾客办理业务所需的时间均为1分钟,所以P(X=2)=P(Y=1)P(Y=1)
=0.1×0.1=0.01;
P(X=1)=1-P(X=0)-P(X=2)=0.49.
所以X的分布列为:
X P 0 0.5 1 0.49 2 0.01 E(X)=0×0.5+1×0.49+2×0.01=0.51. 第三章 综合测试题
一、选择题(本大题共12小题,每小题5分,共60分.每小题中只有一项符合题目要求)
1.在对两个变量x, y进行线性回归分析时有下列步骤:
①对所求出的回归直线方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.
若根据可靠性要求能够作出变量x,y具有线性相关结论,则下列操作顺序正确的是( )
A.①②⑤③④ C.②④③①⑤ 答案 D
解析 由对两个变量进行回归分析的步骤,知选D.
2.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )
A.l1和l2有交点(s,t)
B.l1与l2相交,但交点不一定是(s,t) C.l1与l2必定平行 D.l1与l2必定重合 答案 A
解析 由回归直线定义知选A.
3.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( )
∧
∧
B.③②④⑤① D.②⑤④③①
A.y=x+1
∧
B.y=x+2
∧
C.y=2x+1 答案 A
D.y=x-1
解析 求出样本中心(x,y)代入选项检验知选A. 4.今有一组实验数据如下:
t v 1.99 1.5 3.0 4.04 4.0 7.5 5.1 12 6.12 18.01 现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是( )
A.v=log2t
B.v=log1 t
2D.v=2t-2
C.v=
t2-1
2
答案 C
解析 先画出散点图,利用散点图直观认识变量间的关系,可选出较合适的模型为C,或将数据代入所给选项进行验证.
5.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程中的截距为( )
∧
A.a=y-bx
∧
B.a=y-bx
∧
∧
C.a=y-bx 答案 D
∧
D.a=y-bx
∧
解析 本题考查回归方程中的截距公式a=y-bx.故选D. 6.下面是一个2×2列联表
x1 x2 总计 其中a、b处填的值分别为( ) A.52 54 C.94 146 答案 A
y1 a 2 y2 21 25 46 总计 73 27 100 b B.54 52 D.146 94
解析 由a+21=73,得a=52,a+2=b,得b=54.故选A.
∧
7.设有一个回归方程为y=3-5x,则变量x增加一个单位时( ) A.y平均增加3个单位 B.y平均减少5个单位 C.y平均增加5个单位 D.y平均减少3个单位 答案 B
解析 ∵-5是斜率的估计值,说明x每增加一个单位时,y平均减少5个单位.故选B.
8.在一个2×2列联表中,由其数据计算得K=13.097,则其两个变量间有关系的可能
2
性为( )
A.99% C.90% 答案 A
解析 ∵如果K的估计值k>10.828时,就有99.9%的把握认为“x与y有关系”.故选A.
9.两个相关变量满足如下关系:
2
B.95% D.无关系
x y 10 1 003 15 1 005 20 1 010 25 1 011 30 1 014 两变量的回归直线方程为( ) ∧
∧
A.y=0.56x+997.4
∧
B.y=0.63x-231.2
∧
B.y=50.2x+501.4 答案 A
nD.y=60.4x+400.7
?xiyi-nx y∧
i=1
∧∧
解析 利用公式b=
n=0.56,a=y-bx=997.4.
?x2i-nxi=1
∧
2
∴回归直线方程为y=0.56x+997.4.故选A.
∧
∧
∧
10.线性回归方程y=bx+a必过( ) A.(0,0) C.(0,y) 答案 D
解析 回归直线方程一定过样本点的中心(x,y).故选D.
11.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 C.回归平方和 答案 B
∧
∧
B.(x,0) D.(x,y)
B.残差平方和 D.相关指数R
2
n∧2
解析 yi-y=ei,?ei为残差平方和.故选B.
i=1
12.如果根据性别与是否爱好运动的列联表得到K≈3.852>3.841,所以判断性别与运动有关,那么这种判断犯错的可能性不超过( )
2
A.2.5% C.1% 答案 D
B.0.5% D.5%
解析 ∵P(K≥3.841)≈0.05,故“判断性别与运动有关”出错的可能性为5%. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算得K=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).
答案 有关
解析 K>10.828就有99.9%的理由认为两个量是有关的.
14.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:
温度(x) 溶解度(y) 0 66.7 10 76.0 20 85.0 50 112.3 70 128.0 2
2
2
由此得到回归直线的斜率是________. 答案 0.880 9
n?xiyi-nx y∧
i=1
解析 把表中的数据代入公式b=
n≈0.880 9.
?x2i-nxi=1∧
2
15.用身高(cm)预报体重(kg)满足y=0.849x-85.712,若要找到41.638 kg的人,________是在150 cm的人群中.(填“一定”、“不一定”)
答案 不一定
解析 因为统计的方法是可能犯错误的,利用线性回归方程预报变量的值不是精确值,但一般认为实际测量值应在预报值左右.
16.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表
喜欢吃零食 不喜欢吃零食 合计 男 5 40 45 女 12 28 40 总计 17 68 85 试回答吃零食与性别有关系吗?答有或没有________. 答案 有