抽样分布的研究

2019-06-17 18:17

抽样分布的研究

抽样分布的研究

1 前言

统计量是样本的函数,它是一个随机变量.统计量的分布称为抽样分布. 用来估计一个未知总体参数的抽样统计称为估计. 真实参数值和估计值间的差异称为抽样误差.带有概率分布的随机变量统计称为抽样分布,由重复抽样产生. 我们用统计的抽样分布来测定估计中的抽样,它可分为正态总体下与非正态总体下两种情况来讨论.是由样本n个观察值计算的统计量的概率分布.从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布.从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n的所有可能的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布.

例如:如果特指的统计量是样本均值,则此分布为均值的抽样分布.类似的有标准差、方差、中位数、比例的抽样分布.

统计量是样本的函数,它是一个随机变量.统计量的分布称为抽样分布.

基于独立的,与总体分布的简单随机样本的抽样分布定理,是小样本统计推断的理论基础??.二十世纪20年代以来,由此发展的成熟的简单随机样本统计推断理论,

1已在其他科学的研究中被广泛的应用.但是,在实际的非简单随机抽样普遍的存在着.如经济学中的异方差,生物学中的常相关性??.但有些在应用中直接运用了简单

2随机样本的统计方法,这是不合适的.近些年来,人们在针对实际中不同场合存在的非简单随机样本,研究相应的统计推断理论.为此,本文给出了抽样分布的基础定理及应用.

2 选题背景

2.1 题目类型及来源

第1页(共33页)

抽样分布的研究

题目类型:研究论文 题目来源:专题研究

2.2 研究目的和意义

样本来自总体,因此样本中包含了有关总体的丰富信息,但是这些信息是零散的,为了把这些零散的信息集中起来反映总体的特征,我们取得样本之后,并不是直接利用样本进行推断,而需要对样本进行一番“加工”和“提炼”,把样本中所包含的有关信息尽可能地集中起来.一种有效的办法就是针对不同的问题,构造出样本的某种函数,这就是统计量??.不同的函数可以反映总体的不同的特征.统计量的分布叫抽

3样分布.统计量的性质以及使用某一统计量作推断的优良性,取决于其分布.所以抽样分布的研究是数理统计中的重要课题.寻找统计量的精确的抽样分布,属于所谓的小样本理论的范围,但是只在总体分布为正态时取得比较系统的优良结果.对一维正态总体,有三个重要的抽样分布,即?2分布、t分布和F分布.

2.3 国内外现状和发展趋势与研究的主攻方向

三大抽样分布是数理统计上的三个重要分布,由标准正态分布的总体样本组合而成.利用随机变量函数分布的求法导出三大抽样分布的概率密度函数,给出了三大抽样分布在区间估计和假设检验中的应用.因此,三大抽样分布具有一定的理论意义和实践意义.数理统计成为数学的一个分支的一个奠基人是高斯,他的杰出贡献是发现并导出了正态分布,并在在正态分布的基础上,提出了最小二乘法.卡尔.皮尔逊是公认的现代统计学的创始人,他初步建立了系统的、数据分析的统计学方法,他对于统计学的传播、交流与发展起了极为重要的作用.Karl pearson在创立拟合优度理论的过程中发现了这个分布,Gosse发现t分布的过程正是小样本理论创立的过程??.有

4很多统计推断是基于正态分布的假设,以标准正态分布为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确的背景,而且其抽样分布的密度函数有明显表达式,它们被称为统计学的“三大抽样分布”.

第2页(共33页)

前言

3 抽样分布

3.1 什么是抽样分布

抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布.样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布

?5?.以样本平均数为例,它是总体平均数的一个估计量,如果按照相同的样本容量相

同的抽样方式,反复地抽取样本,每次可以计算一个平均数,所有可能样本的平均数所形成的分布,就是样本平均数的抽样分布.

3.2 抽样分布的类型

3.2.1 单一样本统计量的抽样分布

当我们要对某一总体的参数进行估计时,就要研究来自该总体的所有可能的样本统计量的分布问题,比如样本均值的分布、样本比例的分布,从而概括有关统计量抽样分布的一般规律. (1)样本均值的抽样分布 样本均值抽样分布的形成:样本均值的抽样分布即所有样本均值的可能取值形成的概率分布.例如,某高校大一年级参加英语四级考试的人数为6000人,为了研究这6000人的平均考分,欲从中随机抽取500人组成样本进行观察.若逐一抽取全部可能样本,并计算出每个样本的平均考分,将会得出很多不完全相同的样本均值,全部可能的样本均值有一个相应的概率分布,即为样本均值的抽样分布. 我们知道,从总体的N个单位中抽取一个容量为n的随机样本,在重复抽样条件下,共有N个可能的样本;在不重复抽样条件下,共有 nCN?nN! n!(N?n)!个可能的样本.因此,样本均值是一个随机变量. 第3页(共33页)

抽样分布的研究

(2)样本均值抽样分布的特征 从抽样分布的角度看,我们所关心的分布的特征主要是数学期望和方差.这两个特征一方面与总体分布的均值和方差有关,另一方面也与抽样的方法是重复抽样还是不重复抽样有关. 无论是重复抽样还是不重复抽样,样本均值的期望值总是等于总体均值μ,即: 公式一: E(x)?? 样本均值的方差则与抽样方法有关.在重复抽样条件下,样本均值的方差为总体?22方差的1/n,即公式二: ?x? n在不重复抽样条件下,样本均值的方差为: σ2N?n*公式三: σ? nN?12x从公式二和公式三可以看出两者仅相差系数: N?n N?1该系数通常被称为有限总体修正系数.在实际应用中,这一系数常常被忽略不计,主要是因为:对于无限总体进行不重复抽样时,由于N未知,此时样本均值的标准差仍可按公式二计算,即可按重复抽样处理;对于有限总体,当N很大而抽样比例n/N很小时,其修正系数 N?nn?1?1?. N?1N?1通常在样本容量n小于总体容量N的5%时,有限总体修正系数就可以忽略不计.因此,公式二是计算样本均值方差的常用公式. (3)样本均值抽样分布的形式

样本均值抽样分布的形式与原有总体的分布和样本容量n的大小有关. 如果原有总体是正态分布,那么,无论样本容量的大小,样本均值的抽样分布都服从正态分布.

第4页(共33页)

抽样分布的研究

如果原有总体的分布是非正态分布,就要看样本容量的大小.随着样本容量n的增大(通常要求n≥30),不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,即统计上著名的中心极限定理.虽然总体成绩的分布形态未知,但?已知,且n=150为大样本,依据中心极限定理可知:样本均值的抽样分布近似服从正态分布.

3.2.2 样本比例的抽样分布

样本比例即指样本中具有某种特征的单位所占的比例.样本比例的抽样分布就是所有样本比例的可能取值形成的概率分布.例如,某高校大一年级学生参加英语四级考试的人数有6000人,为了估计这6000人中男生所占的比例,从中抽取500人组成样本进行观察,若逐一抽取全部可能样本,并计算出每个样本的男生比例,则全部可能的样本比例的概率分布,即为样本比例的抽样分布.可见,样本比例也是一个随机变量. (1)样本比例抽样分布的特征 在大样本情况下,样本比例的抽样分布特征可概括如下: 无论是重复抽样还是不重复抽样,样本比例p的数学期望总是等于总体比例P,即: 公式一: E?p??P 而样本比例p的方差,在重复抽样条件下为: P(1?P)?公式二: σ2 pn在不重复抽样条件下为: P(1?P)N?nσ2?() pnN?1(2)样本比例抽样分布的形式 样本比例的分布属于二项分布问题,当样本容量n足够大时,即当np与n?1?p?都不小于5时,样本比例的抽样分布近似为正态分布. 如果要对两个总体有关参数的差异进行估计,就要研究来自这两个总体的所有可能样本相应统计量差异的抽样分布. 第5页(共33页)


抽样分布的研究.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:A320ME飞机放行人员考试

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: