《统计学》课程的教学教案 - 图文(8)

2019-01-19 10:18

二、抽样误差 (一) 抽样误差的基本涵义等 1、 涵义:由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。 2、 性质:(简单复习误差的知识,见第二章,类型) 3、 影响因素——简答题型: 总体各单位标志值的差异程度,样本的单位数,抽样方法,抽样调查组织形式。 (二) 抽样平均误差:反映抽样误差的一般水平。 1、 抽样平均数的平均误差 (1) 在重复抽样条件下,抽样平均数的平均误差和总体的变异程度以及样本容量大小两个因素,即: ux=? n(2) 在不重复条件下,平均误差为:ux=?nN?n N?12、 抽样成数的平均误差 (1)重复抽样条件下 up=?n=p(1?p) nN?n ( ?=p(1-p) ) N?1 (2)不重复抽样条件下up=?n(三) 抽样极限误差: 可允许的误差范围称为极限误差,或者说,是统计量与参数离差的最大范围,即: x-X??x?x-?x?X?x+?x p?P??p?p??p?P?p??p (四)抽样误差的概率度:t??xu t??pxu p ?x?t?ux ?p?t?up t的含义(概率度):表示误差范围为抽样平均误差的t倍,t是测量估计可靠程度的一个参数。

(五)抽样估计的置信度 前面我们学习了两种误差,即平均误差和极限误差,这两种误差有着不同的含义。(简要复习) 抽样平均误差反映抽样误差一般水平,是样本资料和总体之间所有离差值的一个平均数。极限误差指进行抽样在统计工作前设立的一个误差最大值。二者的关系是t?? (??t?u) 用抽样误差u概率度来表示的。 我们客观地承认,只要进行抽样调查,必然存在误差,并且根据经验或工作要求,我们可以设置一个误差最大值,但要使抽样调查结果一定符合误差在极限误差范围内,却并非能够实现。所以要保证误差不超过一定范围的,只能给一定程度的概率保证程度。抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。 举例说明这一概念:现在设我们在很短的时间内要了解某个企业的职工工资水平,由于时间局限,只能在 300名职工中选出10名,来通过10名职工的平均工资水平估计全厂职工水平。假设抽样误差不超过20元,如果这10名职工平均工资为680元,则全厂职工的平均工资水平应为(660,700)。 但是问题在于,如果我们在选样时被选单位工资分布较均匀,那么这种代表性当然很强,出现误差数肯定在20元以内,如果在选样时,被选单位工资过高(或过低),那么算出来的工资与实际水平的误差就可能不止20元了,说明因为随机选样,误差水平均不同,所以无法使得误差水平一定在设定的范围内,而只能说在这个范围内的一种可能程度、概率,比如说有百分之九十的可能会使误差在设定范围内。 由此也可见,抽样估计置信度应是一个以百分比表示的概率数,记作P(概率学中表示概率的符号)。 那么,我们现在来讨论一下P的确定。当误差变化时,概率怎么变化。 1.首先我们看一下P与?的关系。在其它条件不变的情况下: 我们规定的?(极限误差)越大,抽样的把握程度越大; 反之,我们规定的?(极限误差)越小,抽样的把握程度越小。 即 P与?之间是正方向变化。(P与?之间存在一种函数关系) 举例说明:我们以上堂课中举的例子来看,以密云县太师屯、十里堡等几个地(随机抽样的结果)的小麦产量来估计全县的小麦产量,如果设误差最大值?1=100斤,?2=50斤,得 (400,600)、(450,550)两个区间。第一个区间的可能程度应大于第二区间的可能程度,因为它实际上包括了第二个区间的可能性。 2.因为前面我们已经学习到??t?u,所以P与?之间的函数关系也就是P与t、u之间的函数关系,根据样本资料,u作为平均 误差,可以计算出来,是一个常数,这样,P的值就依赖于t数值的确定了,由此可以得到P=F(t)即抽样的置信度可以表示成抽样误差概率度的一个函数,也就是说,P与t值可以互相确定,知道t值就可以求出P值,反之亦然。 如:t=1 F(t)=P=68.27% 查《正态分布概率分t=2 F(t)=F(2)=P=95.45% 布表》 t=3 F(t)=F(3)=P=99.73% t=1.64 F(t)=90% t=1.96 F(t)=95% 三.抽样估计方法 (一)参数估计的方法 1.点估计:统计量作为参数 基本表现形式:x=Xp = P 2.区间估计:(x–?,x + ?) (P-?,P+?) (二)估计的优良标准(填空题、多选题) 1.无偏性:E(x)=X E(p)=P 2.一致性:样本容易?N x?X 3.有效性: u最小 ? 抽样估计精度:(计算) 误差率=?x?x 精度=1—误差率=1— xx (三)总体参数的区间估计 1.在给定的概率保证程度的要求下,指出总体参数可能存在的范围。 2.包括的三个基本要素:见教材P196 :x(估计值)、?(误差范围)、 概率保证程度F(t) 3.题型:P196 (1)已知?,求F(t) (2)已知F(t),求区间(实值求?) x、p?根据样本资料,求根据样本资料,求x、p????求ux、up求u、uxp????步骤:? 步骤:?F(t)已知,则可知t值 ??据t?,求出t,求出F(t)?利用??t?u,求出?u????作区间估计?并求出参数的区间范围?? 例题1.(题型一)复习指导书P106——11 某乡水道总面积2000亩,从中随机抽取40亩(重复抽样),每亩产量资料如下: 每亩产量(斤) 亩数 x xf (x-x)f 2 400—450 450—500 500—550 550—600 600—650 650—700 700—750 750—800 合计(10 20 50 110 100 60 30 20 400 425 475 525 575 625 675 725 775 — 4250 9500 26250 63250 62500 40500 21750 15500 243500 338560 359120 352800 127160 25600 261360 403680 551120 2419400 ?) 要求:极限误差不超过8斤,试估计全乡水稻单产和总产量,并指出到达这一要求的概率保证程度。 解:(1)计算样本平均数和标准差 xf? x??f ???243500?609 4002?(x?x)?f?nf?2419400?77.77(斤) 400 (2)计算抽样平均误差 ux??3.89?4(斤) (3)?x?8 ?t? (4)进行参数估计 ?x ?t?2 F(t)?F(2)?95.45% ux 1 点估计:以95.45%的概率保证该乡水稻平均亩产为609斤,总产量为121.8万斤(2000×609)。 ? 2 区间估计:下限x??x?609?8?601 ? 上限x??x?609?8?617 故以95.45%概率保证,该乡水稻平均亩产在601—617斤之 间,总产量在120.2万斤—123.4万斤之间(2000×601,2000×617) 例题2:(题型二) 某学校进行了一次英语测验,为了了解学生情况,随机抽选部分学生进行调查,所得资料如下: 考试成绩 60以下 60—70 70—80 80—90 90—100 合计 学生人数 10 20 22 40 8 100 x 55 65 75 85 95 — xf 550 1300 1650 3400 760 7660 (x?x)2f 4665.6 2691.2 56.32 2822.4 2708.48 12944 试以95.45%的可靠性估计该校学生英语考试的平均成绩的范围,以及该校学生成绩在80分以上的学生所占比重范围: 解:(1)该校学生考试的平均成绩的范围: x??xf?f?7660?76.6 1002 ???(x?x)?f?n?f?12944?11.377 100 ux?11.377100?1.1377 F(t)=95.45% t=2 ?x?t?ux?2?1.1377?2.2754 该校学生考试的平均成绩区间范围是: x??x?X?x??x 76.6?2.2754?X?76.6?2.2754 74.32?X?78.88 (2)该校学生成绩在80分以上的学生所占比重范围: p?n148??48% n2100p(1?p)0.48(1?0.48)??0.04996 n100 up? ?p?t?up?2?0.04996?0.09992 全校80分以上的学生所占的比重范围为: 下限=p??p=0.48-0.09992=0.3801 上限=p??p=0.48+0.9992=0.5799 所以在95.45%概率保证程度下,该校学生成绩在80分以上的比重范围在38.01%—57.99%之间。


《统计学》课程的教学教案 - 图文(8).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:度米作文汇编之八一建军节300字作文我自豪因为我是军人

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: