(推荐时间:40分钟)
一、选择题
1.(2014·湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2 解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3. 2.某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取一个容量为200人的样本,则高中二年级被抽取的人数为( ) A.28 C.40 答案 D 解析 由已知,得样本容量为400+320+280=1 000, 200所以,高中二年级被抽取的人数为×320=64,选D. 1 000 3.(2013·江西)总体由编号为01,02,?,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 7816 3204 A.08 C.02 答案 D 解析 从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01. 4.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是( ) 6572 9234 0802 4935 B.07 D.01 6314 8200 0702 3623 4369 4869 9728 6938 0198 7481 B.32 D.64 A.240 C.320 答案 D 解析 由频率分布直方图知:学生的体重在65~75 kg的频率为(0.012 5+0.037 5)×5=0.25, 则学生的体重在50~65 kg的频率为1-0.25=0.75. 2 从左到右第2个小组的频率为0.75×=0.25. 6所以抽取的学生人数是120÷0.25=480. 5.某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示: x y ^ ^ ^B.280 D.480 16 50 ^17 34 18 41 19 31 由上表可得线性回归方程y=bx+a中的b=-4,据此模型预计零售价定为15元时,每天的销售量为( ) A.48个 C.50个 答案 B ^ B.49个 D.51个 解析 由题意知x=17.5,y=39,代入线性回归方程得a=109,109-15×4=49,故选B. 6.某校为了研究学生的性别和对待某一活动的态度(支持和不支持的两种态度)的关系,运用2×2列联表进行独立性检验,经计算K=7.069,则所得到的统计学结论是:有________的把握认为“学生性别与支持该活动有关系.”( ) 附: P(K2≥k0) k0 A.0.1% C.99% 答案 C 解析 因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”,选C. 2 0.100 2.706 B.1% 0.050 3.841 0.025 5.024 0.010 6.635 0.001 10.828 D.99.9% 7.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x甲,x乙和中位数y甲,y乙进行比较,下面结论正确的是( ) A.x甲>x乙,y甲>y乙 B.x甲 8.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数、中位数分别为________. 答案 125,124 解析 由图可知(a+a-0.005)×10=1-(0.010+0.015+0.030)×10,解得a=0.025,则x=105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125.中位数在120~130之间,设为x,则0.01×10+0.03×10+0.025×(x-120)=0.5,解得x=124. 9.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得 平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是__________. 答案 1 89+89+92+93+92+91+94640解析 当x≥4时,=≠91, 77∴x<4,∴∴x=1. 10.(2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互 89+89+92+93+92+91+x+90 =91, 7 不相同,则样本数据中的最大值为________. 答案 10 解析 设5个班级中参加的人数分别为x1,x2,x3,x4,x5, 则由题意知 x1+x2+x3+x4+x5 =7, 5 (x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20, 五个整数的平方和为20,则必为0+1+1+9+9=20, 由|x-7|=3可得x=10或x=4. 由|x-7|=1可得x=8或x=6. 由上可知参加的人数分别为4,6,7,8,10, 故最大值为10. 三、解答题 11.(2014·课标全国Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表: 年份 年份代号t 人均纯收入y 2007 1 2.9 2008 2 3.3 2009 3 3.6 2010 4 4.4 2011 5 4.8 2012 6 5.2 2013 7 5.9 (1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为: ^ i=1 ? ?ti-t??yi-y? ^ n ^ n b= i=1 ,a=y-b t. ? ?ti-t?2 1 解 (1)由所给数据计算得t=(1+2+3+4+5+6+7)=4, 71 y=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, 7 i=1 ?=(ti-t)2=9+4+1+0+1+4+9=28, ? (ti-t)(yi-y)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9 7 7 i=1 +3×1.6=14, ^ i=1 ? ?ti-t??yi-y? =i=1 7 b= ? ?ti-t?2 ^ 7 14 =0.5, 28 ^ a=y-bt=4.3-0.5×4=2.3, ^ 所求线性回归方程为y=0.5t+2.3. ^ (2)由(1)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元. ^ 将2015年的年份代号t=9代入(1)中的线性回归方程,得y=0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元. 12.某城市随机抽取一年(365天)内100天的空气质量指数API的监测数据,结果统计如下: API 空气质量 天数 4 13 18 30 9 [0,50] (50,100] 优 良 (100,150] 轻微污染 (150,200] 轻度污染 (200,250] 中度污染 (250,300] 中重度污染 11 15 >300 重度污染 (1)若某企业每天由空气污染造成的经济损失S(单位:元)与空气质量指数API(记为w)的关系式为: 0, 0≤w≤100?? S=?4w-400,100 ??2 000, w>300 ,试估计在本年度内随机抽取一天,该天经济损失S大于200 元且不超过600元的概率; (2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染.完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关? 供暖季 非供暖季 合计 附: P(K≥k0) k0 2 2非重度污染 重度污染 合计 100 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828 n?ad-bc?2K=. ?a+b??c+d??a+c??b+d? 解 (1)设“在本年内随机抽取一天,该天经济损失S大于200元且不超过600元”为事件A, 由200 100 (2)根据以上数据得到如下列联表: 供暖季 非供暖季 合计 100×?63×8-22×7?2K的观测值k= 85×15×30×70 2 非重度污染 22 63 85 重度污染 8 7 15 合计 30 70 100 ≈4.575>3.841. 所以有95%的把握认为空气重度污染与供暖有关.