2、什么是抽样误差?影响抽样误差大小的因素有哪些?
答:抽样误差是指由于抽样的偶然因素使样本各单位的结构不足以代表总体各单位的机构,而引起抽样指标和全及指标之间的绝对离差。影响抽样误差大小的因素有:总体各单位标志值的差异程度、样本的单位数、抽样方法和抽样调查的组织形式。
3、什么是参数和统计量?各有何特点?
答:参数是一个全及指标,它反映了全及总体某种数量特征;统计量即样本指标,它反映了样本总体的数量特征。其特点是:全及指标是总体变量的函数,但作为参数其指标值是确定的、唯一的,是由总体各单位的标志值或标志属性决定的;而统计量是样本变量的函数,是总体参数的估计值,其数值由样本各单位标志值或标志属性决定,统计量本身也是随机变量。
4、什么是抽样平均误差和抽样极限误差?二者有何关系?
答:抽样平均误差是反映抽样误差一般水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标,二者既有联系又有区别。二者的联系是:极限误差是在抽样平均误差的基础上计算得到的,即??t?;二者的区别是:(1)二者涵义不同;(2)影响误差大小的因素不同;(3)计算方法不同。
5、如何理解回归直线方程中待定参数a.b的含义是什么?
回归方程中参数a 代表直线的起点值,在数学上称为直线的纵轴截距,它表
31
示x=0时y的常数项。参数b称为回归系数,表示自变量x增加一个单位时因变量y的平均增加值。回归系数的正负号与相关系数是一致的,因此可以从回归系数的正负号判断两变量相关的方向。
六、计算题
1、某工厂生产一种新型灯泡5000只,随机抽取100只作耐用时间试验。测试结果,平均寿命为4500小时,标准差300小时,试在90%概率保证下,估计该新灯泡平均寿命区间;假定概率保证程度提高到95%,允许误差缩小一半,试问应抽取多少只灯泡进行测试?
解:已知N?5000,n?100,x?4500,??300,F(t)?90%t?1.64,则?x?n300100?1??29.7N5000n100?X?T?X?1.64?29.7?491??平均使用寿命的区间:下限?x??x?4500?49?4451(小时)上限?x??x?4500?49?4549(小时)F(t)?95%,t?1.96Nt2?25000?1.962?3002n???516(只)N?2X?t2?25000?(2)2?1.962?300249
2、调查一批机械零件合格率。根据过去的资料,合格品率曾有过99%、97%、和95%三种情况,现在要求误差不超过1%,要求估计的把握程度为95%,问需要抽查多少个零件?
解:根据提供的三种合格率,总体方差取大值计算,故用P=95%, F(t)=0.95 t=1.96
t2p(1?p)1.962?0.95(1?0.95) n? 约需抽查1825个零件 ??1825(件)?2p0.0123、某单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行
32
考核,考核成绩资料如下:
68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87
要求:(1)根据上述资料按成绩分成以下几组:60分以下,60—70分,70—80分,80—90分,90—100分,并根据分组整理成变量分配数列;(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工?
解: 成绩 组中值 人数 比重
60分以下 55 3 7.5% 60-70 65 6 15% 70-80 75 15 37.5% 80-90 85 12 30% 90-100 95 4 10% 合计 40 100%
x??xf?3080?77(分) ?f40?=??x?x??f?n?2f?4440?10.54(分) 40?x?10.5440?1.67
?x?t?x?2?1.67?3.34
33
x??x?77?3.34??73.66,80.34?
n?t2?2?2?4?10.542?3.34???2??2?444.3664?160 2.9889
4、在4000件成品中按不重复方法抽取200件进行检查结果有废品8件,当概率为0.9545(t=2)时,试估计这批成品废品量的范围 解:p?8?4% ?p?200p(1?p)n(1?)?1.35% nN ?p?t?p?2?1.35%?2.7% 废品率的范围:4%±2.7%
废品率的区间范围在1.3%-6.7%之间。 废品数量区间:4000×1.3%-4000×6.7% 废品量的区间范围在52(件)-268(件)之间。
5、假定某统计总体被研究标志的标准差为50,若要求抽样极限误差不超过4,概率保证程度为95.45%,试问采用重复抽样应抽取多少样本单位?若抽样极限误差缩小一半,在同样的条件下应抽取多少样本单位?
6、检查五位学生统计学原理的学习时间成绩如下表所示:
学习时数(小学习成绩时) 4 6 7 34
(分) 40 60 50 10 13 70 90 根据资料:(1)建立学习成绩(y)倚学习时间(x)的直线回归方程
(2)计算学习时数与学习成绩之间的相关系数
7、根据5位同学西方经济学的学习时间与成绩分数计算出如下资料:
n=5 ?x?40 ?y?310 ?x2?370 ?y2?4000
?xy?2740 ?(x?y)?1480
试:(1)编制以学习时间为自变量的直线回归方程
(2)解释回归系数的含义
解:①配合直线回归方程, 设直线回归方程为yc=a+bx 计算参数a 、b
112740??40?310?x??yn5 b???5.2 1122370??402?x?(?x)n5?xy?
a?y?bx??310?5.2??40?20.4 直线回归方程为 yc=20.4+5.2x
(2)解释回归系数的含义:表示学习时数每增加一小时,成绩
平均增加5.2分
8、根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下:(x代表人均收入,y代表销售额)
n=9 ?x?546 ?y?260 ?x2?34362 ?xy?16918 计算:(1)建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义
35
1515