1、抽样调查的步骤
(1)界定总体 (2)制定抽样框 (3)实施抽样调查并推测总体 (4)分割总体 (5)决定样本规模 (6)决定抽样方式 (7)确定调查的信度和效度 2、抽样方案设计内容
(1)定义目标总体 (2)决定抽样框 (3抽样调查的组织形式和抽样方法的选择 (4)精度的确定 (5)确定样本容量 (6)经费核算
【1. 明确调查目的,确定所要估计的目标量。例如,电视节目的收视率调查、日用品的消费调查等等,往往是以户为单位的;而一般的态度、观念调查,则是以个人为单位进行的。目标量的变动将引起抽样方案的改动,一旦规定好了以后,就不要轻易变更。
2. 明确总体及抽样单元。例如,电视节目的收视率调查,总体一般指在电视覆盖地区的拥有电视的家庭中4岁以上的居民,最小抽样单位一般为“户”。而广播电视的广告、传播效果调查一般以9岁或12岁以上的公民为受众总体,最小抽样单位为“个人”。消费者调查、社会问题的调查的总体一般是指18岁或18岁以上的公民。 3. 确定或构建抽样框。
4. 对主要目标的精度提出要求。例如在收视率的调查中,平均收视率的误差不超过3%等等。
5. 选择抽样方案的类型。例如在收视率调查中采用多级抽样,而在各级中又采用分层抽样等组织形式,最后一级采用等距抽样方式等等。
6. 根据抽样方案的类型、对主要目标量的精确度要求及置信度等等,确定样本量,并给出总体目标量的估计式(点估计或区间估计)和抽样误差的估算式。 7. 制定实施方案的具体办法和步骤。】 3、抽样方法:
简单随机抽样法
这是一种最简单的一步抽样法,它是从总体中选择出抽样单位,从总体中抽取的每个可能样本均有同等被抽中的概率。抽样时,处于抽样总体中的抽样单位被编排成 1~n编码,然后利用随机数码表或专用的计算机程序确定处于1~n间的随机数码,那些在总体中与随机数码吻合的单位便成为随机抽样的样本。
这种抽样方法简单,误差分析较容易,但是需要样本容量较多,适用于各个体之间差异较小的情况。 系统抽样法
这种方法又称顺序抽样法,是从随机点开始在总体中按照一定的间隔(即“每隔第几”的方式)抽取样本。此法的优点是抽样样本分布比较好,有好的理论,总体估计值容易计算。 分层抽样法
它是根据某些特定的特征,将总体分为同质、不相互重叠的若干层,再从各层中独立抽取样本,是一种不等概率抽样。分层抽样利用辅助信息分层,各层内应该同质,各层间差异尽可能大。这样的分层抽样能够提高样本的代表性、总体估计值的精度和抽样方案的效率,抽样的操作、管理比较方便。但是抽样框较复杂,费用较高,误差分析也较为复杂。此法适用于母体复杂、个体之间差异较大、数量较多的情况。 整群抽样法
整群抽样是先将总体单元分群,可以按照自然分群或按照需要分群,在交通调查中可以按照地理特征进行分群,随机选择群体作为抽样样本,调查样本群中的所有单元。整群抽样样本比较集中,可以降低调查费用。例如,在进行居民出行调查中,可以采用这种方法,以住宅区的不同将住户分群,然后随机选择群体为抽取的样本。此法优点是组织简单,缺点是样本代表性差。 多阶段抽样法
多阶段抽样是采取两个或多个连续阶段抽取样本的一种不等概率抽样。对阶段抽样的单元是分级的,每个阶段的抽样单元在结构上也不同,多阶段抽样的样本分布集中,能够节省时间和经费。调查的组织复杂,总体估计值的计算复杂。
4、概率抽样的方法
概率抽样包括有简单随机抽样(又称:单纯随机抽样)、系统抽样(等距抽样)、分层随机抽样(类型抽样)和分群随机抽样等方法。 5、概率抽样的原则
概率抽样的基本原则是:样本量越大,抽样误差就越小,而样本量越大,则成本就越高。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。因此,样本量的设计并不是越大越好,通常会受到经济条件的制约。 [编辑]
概率抽样的原理
概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。 [编辑]
概率抽样的优点 ⑴ 概率抽样包括以下几个方面的优点:
A.、调查者可获得被抽取的不同年龄、不同层次的人们的信息; B、能估算出抽样误差;
C、调查结果可以用来推断总体。
例如,在一项使用概率抽样法的调查中,如果有 5 %的被访者给出了某种特定回答,那么,调查者就可以以此百分比再结合抽样误差,推及总体情况。 ⑵ 另一方面,概率抽样也有一些弊病:
在大多数案例中,同样规模的概率抽样的费用要比非概率抽样高; 概率抽样比非概率抽样需要更多时间策划和实施;
必须遵守的抽样计划执行程序会大量增加收集资料的时间。 6、抽样调查的一般程序: 抽样调查是由五个步骤组成的工作过程。
1、确定调查总体:即明确调查的全部对象及其范围。这是抽样调查的前提和基础。
2、抽样框架的确定和个体编号:抽样框架这是提供抽样所用被调查对象的详细名单。在没有现成名单的情况下,可由调查人员自己编制。个体编号:即对调查总体中的个体进行编号。 3、选择调查样本:需首先确定抽样的技术(随机抽样还是非随机抽样),要确定具体的抽样方法(如分层抽样还是分群抽样)还要确定样本的数量。在上述问题确定后,按预定的要求选择调查的样本。 4、实施调查:对选定的样本运用不同的调查方法逐个进行调查,从而取得第一手资料。
5、测算结果:这是抽样调查的最后一个步骤,也是抽样调查的目的的所在。指用样本指标推断总体指标的结果。具体方法包括百分比推算法和平均推算法等。 7、抽样误差
抽样方法本身所引起的误差。当由总体中随机地抽取样本时,哪个样本被抽到是随机的,由所抽到的样本得到的样本指标x与总体指标μ之间偏差,称为实际抽样误差。当总体相当大时,可能被抽取的样本非常多,不可能列出所有的实际抽样误差,而用平均抽样误差来表征各样本实际抽样误差的平均水平。
抽样误差(sampling error)
抽样误差是指用样本统计值与被推断的总体参数出现的偏差。
抽样误差:指由于抽样的随机性引起的样本结果与总体真值之间的误差。 主要包括:样本平均数与总体平均数之差;样本成数与总体成数之差。
统计误差的来源:一类:登记性误差;二类:代表性误差(A、系统性误差;B、偶然性误差),抽样误差特指偶然性误差。
表示抽样误差的大小,已选择标准误。 影响因素
①抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽
样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。
②总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示吝惜体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。
③抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。
④抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。 表现形式
1、抽样实际误差:抽样实际误差是指在一次具体的抽样调查中,由于随机因素引起的样本指标与总体指标之间的离差。如样本平均数与总体平均数之间的绝对离差,样本成本与总体成本之间的离差。但是,在抽样中,由于总体指标数值是未知的,因此,抽样实际误差是无法计算的。同时,抽样实际误差仅仅是一系列可能出现的误差数值之一,因此,抽样实际误差没有概括所有可能产生的抽样误差。
2、抽样平均误差:抽样平均误差是指抽样平均数的标准差或抽样成数的标准差。从一个总体中我们可能抽取很多个样本,因此样本指标如样本平均数或样本成本数将随着不同的样本而有不同的取值,它们对总体指标如总体平均数或总体成本数的离差有大有小,即抽样误差是个随机变量。而抽样平均误差则是反映抽样误差的一般水平的一个指标,但由于样本平均数的平均数等于总体平均数,样本成本的平均数等于总体成数,因此,我们不能用简单算术平均的方法来求抽样平均误差,而应采取标准差的方法来计算抽样平均误差。
3、抽样极限误差:抽样极限误差就是指样本指标与总体指标之间的误差范围。
9、整群抽样又称聚类抽样。(Cluster sampling)是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。 1优缺点
整群抽样的优点是实施方便、节省经费;
整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。 样本分布面不广、样本对总体的代表性相对较差等缺点。
2实施步骤
先将总体分为i个群,然后从i个群中随机抽取若干个群,对这些群内所有个体或单元均进行调查。抽样过程可分为以下几个步骤:
一、确定分群的标注
二、总体(N)分成若干个互不重叠的部分,每个部分为一群。 三、据各样本量,确定应该抽取的群数。
四、采用简单随机抽样或系统抽样方法,从i群中抽取确定的群数。
例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等。
3区别
整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。
分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;
分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。 4适用情况
整群抽样方法的运用,需要与分层抽样方法区别。当某个总体是由若干个有着自然界限和区分的子群(或类别、层次)所组成,同时,不同子群相互之间差很大、而每个子群内部的差异不大时,则适合于分层抽样的方法;反之,当不同子群之间差别不大、而每个子群内部的异质性比较大时,则特别适合于采用整群抽样的方法。[1] 5整群抽样的误差
整群抽样的误差视各群单位方差大小而定,各群单位方差的简单平均数是计算其抽样平均误差的依据。从公式上看,整群抽样平均误差的公式与类型抽样平均误差的公式相似,用R表示全及总体中划分的群(组)数。r表示被抽中的群(组)数。表示抽样总体各群(组)方差的平均数。