接近于正态分布。
13、在确定样本单位数的过程中,如果有数个标准差可供选择,一般应选择较 ;而如果没有成数的标准差,则可用 据以计算样本容量。
14、抽样单位数增加2倍,随机重复抽样平均误差 为原来的 ;若抽样单位数减少20%,随机重复抽样平均误差 为原来的 。
2 15、某随机变量x的方差?x未知,从中抽取容量为n的样本,用样本方差
2sx?1222是?x的 ,?x称作 。 (x?x)2来进行估计,则sx?n?1 五、简答题
1、什么是随机原则?在抽样调查中为什么要遵循随机原则?
2、在一些问题的研究中,为什么要用随机抽样的方法,而不用全面调查的方法? 3、抽样的组织形式有哪几种?各有什么特点? 4、影响抽样误差大小的因素有哪些?
5、什么是总体分布?什么是抽样分布?它们之间有什么区别与联系? 6、抽样估计的精确度与可靠程度是否存在矛盾?为什么?
7、为什么抽取样本时多采用不重复的抽样方法?而计算平均误差时又常用重复抽样的公式计算?
8、简述点估计的优点及其局限性。
9、抽样平均误差、抽样极限误差和概率保证程度三者之间有什么关系? 10、影响抽样单位数多少的因素有哪些? 六、计算题
1、一大批产品中优质品占一半,现每次抽取一件,看后放回再抽,问在100次抽取中取得优质品次数不超过45的概率约等于多少?
2、设总体X ~ N (X, 1 ),从中抽取容量为3的样本:X1、X2和X3,且x1=0.5X1 + 0.3X2 + 0.2X3、x2=0.5X1 + 0.25X2 + 0.25X3、x3=0.4X1 + 0.3X2 + 0.3X3,试问x1、x2和x3是否都是X的无偏估计,并求出其中哪一个最有效。
3、某一批产品的次品率为10%,随机抽取500件,次品在60件以上的概率有多大? 4、某小型航班可乘坐50人,净载重为3600公斤,若来往乘客平均体重为68公斤,标准差为12公斤。试计算在航班坐满的情况下,超重的概率有多大?在计算概率时作了什么假设,此假设有何不妥之处?
5、某工厂需购进大量垫圈,垫圈的厚度要求在0.46 ~ 0.54厘米之间。现有两个工厂可以供货,甲厂的垫圈平均厚度为0.5厘米,标准差为0.025厘米,每千个垫圈售价为10元;乙厂的垫圈平均厚度为0.5厘米,标准差为0.028厘米,每千个垫圈售价为9元。你觉
31
得在合格品价格较低的情况下,应向哪个工厂购买?
6、在重复抽样条件下,若抽样单位数增加了3倍,或减少了50%,其他条件不变,抽样平均误差将分别发生怎样变化?
7、一种袋装花生的颗粒数量服从正态分布,已知有约6.68%的袋装花生在130粒以上,约有15.86%袋少于100粒,试计算该种袋装花生的平均粒数和标准差。
8、袋装食品的机器,装袋时的重量均值可以在200~500克之间调节,但标准差独立于均值均为3克。若每次抽取36袋检查,要求其每袋平均重量至少是250克的概率为95%,机器应调节至平均装多少克?
9、某城市从5 000名产业工人中,不重复地抽取了250名进行调查,并求出其中女工人数所占比重,其抽样结果如下: 按收入分组(元/人) 500以下 500 —— 600 600 —— 700 700 —— 800 800 —— 900 900以上 合 计 产业工人数(人) 20 50 100 40 30 10 250 其中:女工人数(人) 4 10 20 8 5 3 50 试按上表资料计算:
①分别计算工人收入的抽样平均误差和女工比重的抽样平均误差;
②以95.45%的概率保证估计5 000名工人的收入范围;以86.64%的概率保证估计女工比重的范围;
③如需使平均收入的抽样误差不超过其抽样平均数的2%,女工所占比重不超过其抽样成数的1.5%,并均以95%的概率保证,则以后调查同一总体时,应该确定多大的样本容量? 10、在10000名工人中,重复地随机抽取144名工人检查其完成的土方工程量,结果测得人均完成的工程量为4.95m2,方差为2.25,若以此推算10000名工人的平均工作量,将落在什么范围内的可靠程度可达95.45%?
11、按5%的比例,不重复地随机抽取500件产品中,有95%的一级品。试计算一级品的抽样平均误差;若要求以不超过2%的极限误差估计全部产品的一级品范围,其可靠程度可达到多少?在此范围内的一级品数量是多少?
12、对金属切削机床进行使用时间调查,不重复地随机抽取了400台(仅为全部金属切削机床的很小部分),抽样资料如下: 车床使用时间(年) 10 以下 32
10 — 20 20 以上 车床台数比重(%) 25 48 27 均以z = 2的概率保证程度,分别估计三组不同时间车床台数比重的可能范围。 13、对某生活小区的40户居民家庭进行抽样调查,得平均每户居民家庭每月的书报费支出为46元,抽样平均误差为4元。试问整个生活小区的居民家庭平均每月的书报费支出在42~52元之间可能性有多大?
14、某农场有水稻10000公顷(1公顷 = 100公亩 = 10000平方公尺)。在收割前抽样调查了100平方公尺的水稻样本,测得每平方公尺水稻产量为1公斤,标准差为0.1公斤,要求按重复抽样方法计算极限误差(概率为0.9545),并推算全农场的水稻总产量。
15、某地区种植小麦,根据以往几次调查的结果,收获量的标准差为每平方公尺35克、40克和50克,现要抽取样本据以估算全区的小麦产量,以0.9545的概率保证,精确度为每平方公尺不超过10克,则样本容量应为多少?
16、某县收购花生,已知过去几次抽样调查的合格率分别为91%、92%和93%,今年要求把握程度为0.8664,允许误差不超过3%,问需要抽多少包花生?
17、某机械厂采用纯随机不重复抽样方法,从1000箱已入库的某零件中抽取了100箱进行质量检验,对抽中的箱内零件进行全面检查,结果如下:
废 品 率(%) 1 —— 2 2 —— 3 3 —— 4 合 计 根据以上资料计算:
①当概率保证为68.27%时,废品率的可能范围;
②当概率为95.45%时,若限定废品率不超过2.5%,应抽检的箱数为多少?
18、对某型号电子元件10000支进行耐用性能检查,根据以往抽样测定,有耐用性能标准差49.86小时和51.91小时;有合格率91%和88%。试计算:
①概率保证程度为86.64%,元件平均耐用时数的误差范围不超过9小时,分别在重复与不重复条件下,计算应抽取的元件数;
②概率保证程度为99.73%,合格率的极限误差不超过5%,分别在重复与不重复条件下,计算应抽取的元件数;
③在不重复抽样条件下,要同时满足①、②的要求,需抽多少元件。
19、某商店有20名职工,现从中抽取5名,若采用简单随机抽样,试计算重复与不重复抽样的两种不同方法的可能样本数目。
33
箱 数 60 30 10 100 20、从某村的全部粮食播种面积(N = 5000亩)中,按分类抽样法调查了粮食产量,得有关数据如下: 按耕地类型 分 组 平 原 山 地 合 计 播种面积 (亩) 3500 1500 5000 抽样面积 (亩) 35 15 50 样本平均亩产 (kg) 680 420 602 样本标准差(σ) 80 120 93.8 试根据上述资料估计该村的粮食总产量可能是多少?(概率0.9545)
第六章 相关与回归分析
一、单项选择题
1、两变量之间的相关关系称为:
A 单相关 B 复相关 C 多元相关 D 不相关
2、随着物价的上涨,商品的需求量相应减少,则两者之间: A 不相关 B 存在正相关 C 存在负相关 D 存在完全相关 3、在相关分析中,要求相关的两变量:
A 都是随机变量 B 都不是随机变量 C 其中自变量是随机变量 D 其中因变量是随机变量 4、当自变量x值增加时,因变量y值随之下降,则x与y存在着: A 正相关关系 B 负相关关系 C 曲线相关关系 D 直线相关关系 5、某税种的应交税金与应纳税额之间的关系为: A 相关关系 B 函数关系 C 因果关系 D 回归关系
?= a + bx中,b表示: 6、在简单回归直线 y A 当x增加一个单位时,y增加的数值 B 当y增加一个单位时,x增加的数值 C 当x增加一个单位时,y平均增加的数值 D 当y增加一个单位时,y平均增加的数值 7、判断现象之间相关关系密切程度的主要方法是: A 对客观现象作定性分析 B 编制相关表
34
C 绘制相关图 D 计算相关系数 8、相关系数的取值是:
A 0 ≤ r ≤ 1 B -1 < r < 1 C r ≥ 0 D -1 ≤ r ≤ 1 9、三个或三个以上变量之间的相关关系叫: A 单相关 B 复相关 C 直线相关 D 曲线相关 10、现象之间的相关程度越低,则相关系数越: A 接近+1 B 接近-1 C 接近0 D 接近∞
11、下列根据两现象计算的相关系数r中,相关程度较高的是: A r = 0.86 B r = -0.92 C r = 0.65 D r = -0.15 12、计算估计标准误差的依据是:
A 自变量的变差 B 因变量的总变差 C 因变量的回归变差 D 因变量的剩余变差 13、相关系数:
A 只适用于曲线相关 B 可用于直线,也可用于曲线相关 C 只适用于直线相关 D 不适用直线,也不适用于曲线相关
14、已知?(x?x)2= 400,?(y?y)2= 3000,?(x?x)(y?y)= -1000,则相关系数应为:
A 0.925 B -0.913 C 0.913 D 0.957
?= 270 - 15、每一吨铸件的成本y(元)与工人劳动生产率x(吨/人)之间的回归方程为y0.5x,这意味着劳动生产率每提高一个单位,成本就: A 提高270元 B 提高269. 5元 C 降低0.5元 D 提高0.5元
16、对居民收入x与消费支出y的几组数据配合出以下回归方程,哪个可能是正确的:
?= 120 - 0.5x B y?= 125 + 0.7x A y?= 120 - 0.5x D y?= 125 + 1.8x C y 17、根据最小二乘法原理所配合的一元线性回归方程,是使:
?)?0 A、?(Yi?Y)?0 B、?(Yi?Y?)2为最小 C、?(Yi?Y)为最小 D、?(Yi?Y35