[键入文字]
数学性质;复旦98<简>:简述变项的测量层次及其划分意义):(1)定类尺度或名义尺度:测量定类变量的尺度,它是测量尺度中最低的一种,大多数定性测量都适用定类尺度。其严格的区分可分为:<1>标记:可作为一个识别的记号,当数字被用作标记时,它并不表示数量的多少,也不能对它做数量运算;<2>类别:可作为对变量的不同状态的度量,类别区分可说明观测对象的某些本质特征.类别也可用数字表示,这种数字仅用于区分而不能运算。 (2)定序尺度或等级尺度:一个变量如果能够依操作定义所界定的明确特征或属性而排列等级大小、高低、先后的次序,这是就适用于定序尺度进行测量。定序测量程序:<1>等第顺序法,它要求被试者对一组刺激依某种属性由高到低或由多到少的次序予以排列。<2>配对比较法:要求被试者在一定时间内就所有可能的配对,排列出每对刺激中的大小或多少的顺序。<3>恒常刺激法:这种方法与配对比较法相类似,唯一不同之处是它以一种标准刺激连续地与一组恒常刺激的各个成员相配对地进行比较。<4>连续性类别法:要求被试注意:它们使用的数字仅仅显示等级顺序而已,除此之外,别无其他意义。这些数字并不显示属性的真正量值,并且等级之间的间隔也不一定相等。(3)定距尺度或等距尺度:具有定类尺度和定序尺度的特征,此外,它还要求尺度上的间距代表所测量的特征的量的间距。即每一等级之间的间距是相等的,它们可以用来加减。但定距尺度上没有绝对的零点,所以不能乘除。 (4)定比尺度或比例尺度:是测量中的最高层次,具有实在意义的真正零点,定比尺度下的数字是可以进行加减乘除的,运算的结果都具有实在的意义。一个变量能否以定比尺度测量,关键在于零点是否是绝对的,最好的检验办法是:零是否可被认为是测量“一无所有”的。(5)四种测量尺度比较(南大2000<简>:定距变量可以变为定序变量吗?反之如何?请举例说明):从数学性质上看,高层次尺度都具有低层次尺度的一切特征,反之则不然。选择测量尺度须注意:<1>社会现象大多只能以定类或定序尺度测量,但有时也可将某些现象近似的视为定距或定比变量,如“智力测验”。这时要注意这种近似计算的合理性和可能出现的偏差。<2>高层次尺度可能获得更多、更精确的信息,但调查和分析的工作量更大,而低层次尺度则相反。因此选择尺度要结合课题要求与研究条件。 <3>用较低尺度收集的资料不能用较高尺度的数学运算来处理,反过来则可以。因此许多研究都是尽量先收集更多、更精确的信息,但在分析时却只作一些简单的运算,这虽然会造成很大的浪费,不过当需要今后作补充分析时,这种策略还是有必要的。<4>一个变量可能适合用各种尺度来测量,选择何种尺度取决于研究所要求的精确度。
48、 概念的具体化与操作化(北大93<简>:试说明概念与假设的操作化过程;北大97<简>:试说明研究课题具体化与操作化的主
要内容;北大2000<简>:简述一项调查研究课题的具体化与操作化;南大96<名>:课题操作化;南大95<简>:怎样具体确定测量的尺度;复旦98<简>:课题具体化和操作化的主要内容):因为社会生活中使用的概念通常是模糊的或含义不清的,社会研究如果不对这些概念作出定义和具体化,也就无法对现象进行观察和度量。(1)概念的具体化(浙大2000、2001<简>:试述拉扎斯菲尔德的概念具体化;南大94<简>:如何从概念中引出指示项;北大95<问>:简述概念、变量、调查指标的定义、各自在社会调查中的作用及三者的关系;南大98<简>:对社会学研究概念举例说明概念的来源;复旦96<简>:什么是理论、假设、概念、变量、指标及它们之间的相互关系):<1>概念的形成:概念是在日常生活中通过感性认识和互相交流形成的。是人们对许多现象的复杂而又具体的感受,并以一个名字对这些感受作出整体的、含混的概括。概念是人们思维的产物,它是抽象的,无法直接观察的,因为它本来并不存在,是人们创造了它。<2>概念的界定:使用抽象定义将概念所指的现象于其他现象区分开来。(A)界定的第一步是将概念分解:即从不同角度或维度对概念所表示的现象进行分类,对有些高度抽象的概念要逐步分解;(B)第二步是作出抽象定义:通过分解可大致了解一个概念的基本内容和各种分类,根据分类就可以抽出各种类型的共同属性和特征对概念下定义。在社会研究中,抽象定义的作用是对在何种范围、何种含义上使用这一概念作出精确的说明,因为概念包括许多方面和不同维度。经过严格界定的概念称为变量,变量具体指概念内涵的各种类型或各种状态,它们对应于各种实际存在的事物,因此变量是可以观察和量度的。概念转换为变量形式之后就可以进入科学研究的领域了。<3>选择测量指标:确定如何测量变量,选用哪些指标来测量。指标是概念内涵的指示标志,它们直接表示经验层次的现象。指标可以量度现象的不同状态和不同程度。由经验现象的量度就可以说明抽象层次的概念。但指标只表示概念内涵的某一方面或某一部分内容,因此要更有效的测量概念就需要用多个指标。对概念(变量)的具体量度的方案也称为概念的操作定义。<4>编制综合指标:对简单的概念可以用一两个指标来测量,而对复杂的概念,则要用多个指标来测量。<5>概念的具体化过程就是一步步从抽象层次下降到经验层次,使概念具体化为可观测的事物。(2)操作定义(复旦98<名>;南大98<名>:古典操作定义):就是建立一些具体的程序或指标来说明如何测量一个概念。<1>操作定义的功能:(A)澄清概念在研究中所选用的意义;(B)说明测量变量的操作方法;(C)使一些陈述变量间关系的假说获得验证的机会;(D)使今后同样的研究有所根据,以便比较彼此的结果。(3)测量指标(北大2003<名>;北大93<名>:变量与指标):指标是反映社会现象变异特征的范畴。是对社会范畴的变异方面的规定性加以具体化。它把现象的质的方面与量的方面密切的结合起来,以便精细描述社会现象的某一特征。测量时首先要说明指标,任何一个变量都有许多不同的指标,这是因为测量所依据的事实可以不一样。当一个变量有多个指标时,可以从中挑选若干个来测量变量,挑选指标的原则
第 11 页 共 49 页
11
者把一群刺激分为若干不同的类别,这里的类别已按指定的属性而予以顺序排列。
[键入文字]
是方便与适当。各项指标可以分别研究,但有时需要将各项指标综合起来,以提高变量的抽象程度。建立综合指标的方法:类型法、指数法和量表法(4)建立综合指标:<1>类型法:将各指标交互分类,然后建立新的类型,以形成一个新的指标;<2>指数法:是用简明合理的公式综合各指标,以建立一个新的指标。
49、 量度化方法:通过测量而得来的资料可分为三种纬度:(1)物理纬度:可以用客观的标准来测量,而不涉及主观判断。这些量度
一般都属于定距或定比尺度。但这种量度只适合于某些社会现象。如事物的状态特征和行为特征。(2)心理物理纬度:包含物理纬度和心理纬度。一般认为,测量心理属性最多可达到定序尺度,而无法使用定距尺度。(3)心理纬度:是利用主观判断所制定的计量标准。缺点是:它们缺乏一套完善的测量理论,即缺乏公理和定理的系统。
50、 观测值的分解:测量理论的基础是数理统计中的误差理论或变异理论。测量理论建立在“任何观测值(测量分数或测量结果)都
有误差”这一假设之上。(1)它认为,观测值(X)是有四个部分组成的:<1>真实值T。<2>其他变量的影响值O。<3>系统偏差B。<4>随机误差E。(测量分数)X=T+O+B+E (2)随机误差(E)是非系统的变异,它是由于一些无法预料的因素引起的,如被测者的疏忽,粗心等。但是这种影响有正有负,所以要消除或减少随机误差,通常采用多次测量或抽取大量样本的方法,使正负误差相互抵消。(3)系统偏差(B)(南开2001<名>)是有规则的变异,它是由于测量工具、评分标准等直接与测量方法有关的因素引起的。消除或减少系统偏差的方法是采用标准化的测量工具;在测量之前将测量工具与标准尺度相互校对,以修正偏差。但有些系统偏差很难用标准化消除。(4)其他变量的影响(O):也是一种有规则的变异,这种因素不是偶然的,而是内含在测验的题目或量表之中的。这种影响并不能通过多次测验而消除,它是内含在测量指标之中的。消除或减少这种影响主要通过对所研究的变量进行严格的操作化。(5)在评价社会研究中所使用的测量方法时必须考虑以下三个问题:<1>这一测量有没有系统偏差?这种系统偏差会不会影响研究的有效性?一般来说,任何测量都会有一定的系统偏差,因此,测量的主要任务就是使系统偏差控制在最小程度。<2>这一测量是不是可靠的?即随机误差对测量的可靠性有没有影响?假如测量受偶然因素影响很大,观测值就会在较大范围内起伏,在这种情况下,观测是不可靠的,测得的观测值其可信性很低。<3>这一测量是不是有效的?即所测得得数值是否正是想要研究的变量值,其他变量的影响值是否控制为最小?
51、 信度(南大98<名>;北大2004<名>;人大07名):指测量数据(资料)与结论的可靠性程度,即观测工具能否稳定地测量到
它要测量的事项的程度。也就是说信度是指测量的稳定性与一致性而言的。(1)信度系数:信度可以看作系统性变异在观测到的总变异中所占的比率,系统性变异越大,则信度系数越大,表明测量的信度越高;信度也可以看成是在观测到的总变异中,不是因随机误差所造成的变异所占的比率。(2)信度的检查(南开2000<名>):信度通常以相关系数表示。由于测量中误差变异的来源有所不同,故各种信度系数分别说明信度的不同层面而具有不同的意义。在实际应用中,信度系数有如下类型:<1>重测信度:(人大06名)用同一份问卷的问题,对同一群被测者前后调查两次,在根据调查的结果,计算其相关系数,就得到重测信度。这种信度能表示两次调查结果有无变动,反映了测量的稳定程度,故又称作稳定系数。它可以检查出被测者是否能正确理解所提的问题,并作出真实稳定的回答。这是一种测量信度的较好方法,但须注意两次调查相隔的时间要适当,如果时间太短,被测者还记得上次答案,所以测量的是他的记忆,而不是他此时的真实态度。如果间隔时间太长,可能会发生一些变故,影响到被调查者的态度。<2>复本信度:对一项调查的问题,让被调查者接受问卷测量,并同时接受这份问卷的复本的调查,然后根据调查结果计算其相关系数,就得到复本信度。使用复本求取信度可以避免重测信度的缺点,但使用的复本必须是真正的复本,即在题数、形式、内容、难度及鉴别度等方面都与原本一致,仅只在问法与用词方面与原本不同。复本调查可连续或相距一段时间进行,连续实施的复本信度又称等值系数;相聚一段时间实施的复本信度又称稳定与等值系数。<3>折半信度(人大05名):将调查来的结果,按题目的单、双数分成两半记分,在根据各个人的这两部分的总分,计算其相关系数,就得到折半信度。<4>评分者信度(人大2001<名>):在测量工具标准化程度较低的情况下,不同评分者的判分标准也会影响到测量信度,要计算评分者信度,可计算一个评分者的一组评分与另一个评分者的同一组评分的相关系数。(3)影响信度的因素:在结构化标准化程度较高的测量中,信度主要受随机误差的影响,随机误差越大,信度越低。随机误差的来源主要有:<1>被调查者:如是否耐心、认真、专注、不受情绪波动影响。一般来说,调查时间越长,提出的问题越多、越复杂,信度越低。<2>调查者:是否按规定程序和标准,是否有意或无意的对被调查者施加影响,纪录的认真程度等。<3>测量内容:如提问的措辞含糊不清,不易理解,各种题目内部一致性低,题数少等。<4>测量环境和时间:如研究人员对被调查者有较大“干扰”,他人在场的影响,两次测量的时间间隔太长等等。 52、 效度(南大96、97、2000<名>,人大07名:测量效度;浙大2000<名>:测量的效度):就是正确性程度,即测量工具确能
测出其所要测量的特质的程度。效度越高,即表示测量结果越能显示其所要测量的对象的真正特征。测量的效度可以决定所建立的理论解释的正确程度。对效度的检验可以保证不同的研究人员对某一研究变量的意义与内涵有一致的理解。(1)效度的基本原理:从测量分数变异的观点来看,效度就是测量得分的总变异量中,由所要测量的特质所造成的变异量所占的百分比。(2)效度的检查(复旦96、97<简>:效度测定的三种类型是什么?内在联系如何?):<1>内容效度(表面效度)(北大97<名>,人大
第 12 页 共 49 页
12
[键入文字]
04、06名):考察内容效度旨在系统的检查测量内容的适当性,并依据我们对所研究的概念(变量)的了解去鉴别测量内容是否反映了这一概念的基本内容。内容效度实质上是个判断问题。检查内容效度就是检查由概念到指标的经验推演是否符合逻辑,是否有效。在科学研究中,需要以大多数科学家所接受的概念定义为标准。 <2>准则效度(效标效度)(人大03名,南大95<名>:标准效度):准则是被假设或被定义为有效的测量标准,符合这种标准的测量工具可以作为测量某一特定现象或概念的效标。对同一概念的测量可以使用各种测量工具,其中每种测量方式与效标的一致性称为准则效度。(A)如果效标或准则是依据将来实际发生的情况而建立的,那么这种准则效度可称为预测效度。(人大05名)预测效度是将已经得到的测量结果与未来实际发生的情况进行比较,以检查两者的一致性。(B)如果效标是与某种测量方式同时被证明为有效的,则称之为共变效度。共变效度是用来判断其他的测量工具是否可以取代作为效标的测量工具。(C)如果效标是以实际经验判断为准的,则称为实用效度。实用效度通常用来检查测量工具的实际效果。由于对某些现象的测量过去并没有一定的标准,所以只能依据实际经验来检验测量工具的有效性。实用效度与共变效度有些近似,如定量化的干部测评方法就是以组织部门传统的考察干部的方法为效标,当它具有较高的准则效度的局限:有些作为效标的测量工具只是假定有效的,它本身是否真正有效并没有理论根据,这一缺陷是心理量度化方法所共有的<3>建构效度(南大99<名>;复旦97、98<名>):是要了解测量工具是否反映了概念和命题的内部结构。它通常在理论性研究中使用。由于它是通过与理论假设相比较来检查的,因此也称为理论效度。测量同一个概念可以用多个指标,当用X和Y的多个指标来测量两个概念之间的关系时,如果不同指标的测量都反映出理论所假设的关系,那么这些测量就具有建构效度。<4>内在效度与外在效度(北大2003<名>:内在无效度):测量都是在具体的时间、地点对具体的调查对象所作的观测。如果在一项具体研究中,对上述三种效度(内容效度、准则效度、建构效度)的检查都没有发现问题的话,就可以认为这一研究具有内在效度,它的资料和结论可以有效的解答所研究的问题。可以说,内在效度是指一项研究的资料和结论的有效性。而外在效度是指这种研究结论的普遍有效性。对外在效度的检查要考虑样本的代表性和特殊性,以及研究时间、地点、情境和研究内容的普遍意义。
53、 信度与效度的关系(北大93<名>;北大96<问>:说明测量的信度与效度及其相互关系):(1)信度低效度不可能高。如果收
集的资料不可信、不可靠,那么它肯定不能有效地说明所研究的对象。(2)信度高,效度未必高(效度有可能很低)。(3)效度低,信度有可能很高。(4)效度高,信度必然也高。如果有效地说明了各种现象,那么它的资料和结论都必然是且必须是可信的。(5)测量的信度是效度的必要条件,但不是充分条件,无信度必然无效度,但有信度未必有效度。反之,效度是信度的充分条件但不是必要条件,有效度必然会有信度,但无效度却未必无信度。(6)效度=信度-?x?o度系数减去?o22222,由此可知,效度系数等于信?o/?x效标效度时,由于它省时间、简便易行,所以就能取代过去沿用的老方法。
22。由于其他变量的影响是内含在测量工具之中,因此很难测出他们的变异量(?o),而信度系数则可由相关/?x系数计算。所以在一些研究中,研究者常用信度系数来近似的说明效度,但这是有缺陷的,因为在社会研究中,其他无控制的变量对资料的效度有很大影响。所以还是应当通过对内容效度、准则效度和建构效度的检查来说明研究的有效程度。(7)由信度和效度的关系可知,所有影响信度的因素也必然影响效度。此外,除随机误差外,效度还受到系统偏差和其他变量的影响。对这些影响可主要考虑两个方面:<1>测量工具;<2> 样本的代表性。
第七章:抽样
54、 抽样与抽样调查(北大2004<简>:抽样调查的基本原理):抽样调查:从研究对象的整体中选出一部分代表加以调查研究,然
后用所得结果推论和说明总体的特性。这种从总体中选出一部分的过程就是抽样,所选出的这部分代表称为样本(人大2000<名>)。(1)与整体调查相比,抽样调查的优越性:<1>调查费用较低;<2>速度快;<3>应用范围广;<4>可获得内容丰富的资料;<5>准确度高。(2)抽样成功的依据(假设):<1>部分是包含于整体之中的;<2>部分与整体有同样的特征、现象、关系及过程;<3>部分能够为研究者提供一个有关群体生活、群体态度、价值和意见的更为清晰的脉络。
55、 抽样术语:(1)个体与抽样单位(人大97<名>:抽样单元):个体是收集信息的基本单位,即分析单位。个体与抽样单位在有些研究中是相同的,但在实际抽样中,抽样单位往往是多层次的。(2)研究总体和调查总体(复旦97<名>:研究圈;人大2000<名>:总体):研究总体是在理论上明确界定的个体的集合体,它必须受几个方面的限定:内容、单位、范围、时间。实际上,样本是从调查总体而不是研究总体中抽取的。调查总体是研究者从中实际抽取调查样本的个体的集合体。它往往是对研究总体的进一步界定,即对时间、范围作更进一步规定。(3)抽样框(北大2002<名>;复旦97<名>;南开2000<名>;南大99<名>):又
第 13 页 共 49 页
13
[键入文字]
称抽样范畴,是从中抽取样本的抽样单位名单。在一次抽样中,抽样框的数目是与抽样单位的层次相对应的。(4)参数值与统计值(人大97<名>:参数、估计量;):参数值是关于总体中某一变量的综合描述。统计值则是关于调查样本中某一变量的综合描述。抽样调查的重要内容之一就是通过样本的统计值推算总体的参数值,从而达到由部分认识总体的目的。(5)抽样误差(北大99<名>;复旦96<名>):总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时总会有偏差,这种偏差就是抽样误差。(6)置信水平与置信区间:置信水平是指总体参数值落在样本统计值某一正负区间内的概率。而置信区间是指在某一置信水平下,样本统计值与总体参数值的误差范围。
56、 抽样的基本程序:(1)界定研究总体和调查总体。对研究总体的界定过程也就是对它的基本构成单位,所包含的内容以及空间
与时间的范围等作出规定的过程,同时也是确定调查对象,及它的内涵、外延及数量的过程。(2)确定抽样单位,编制抽样框。即将总体案抽样单位划分为各部分,这些部分必须互不重叠且能合成总体,然后毫无遗漏的编号排列成表,每个抽样单位唯一的与表上的一个号码相对应。抽样框是概率抽样一个最基本的要求,它的质量关系着抽样的质量。(3)设计和抽取样本。包括确定样本所包含个体的数目,选择抽样的具体方法。(4)评估样本与对总体进行估计。样本对于总体的代表性问题始终是抽样中关注的中心问题。
57、 样本准确性与精确性(北大95<问>:抽样调查中的误差份哪两类?其来源是什么?如何减少两类误差?北大2002<简>:简述
影响调查样本代表性的主要因素):(1)样本准确性:指样本没有偏差。偏差也称系统误差,其来源主要有:<1>抽样程序的缺点,即未能遵守随机原则;<2>无回答,无回答是样本偏差的主要来源之一。事实上,一个包含比初始选定的单位少于80%的样本几乎肯定是有偏差的,在这种情况下应通过二访、三访或其他手段提高回答率。(2)样本精确性:指抽样误差的大小。抽样误差是抽样这种方法所固有的误差,是随机误差。抽样误差可以定量进行估计,因此研究人员对于抽样误差的估计具有很大的主动性。(3)样本评估:样本评估分两阶段,正式调查前和结束后,后者是计算抽样误差并由样本统计值推论总体参数值等。在确定了样本规模和抽样方法抽出样本后,应先对抽出的样本进行评估,目的是初步检查样本对于总体的代表性,以剔出那些偏差太大的样本,重新抽样。评估可以采取收集若干容易得到的资料,例如年龄、性别、文化程度等作为样本于总体之间的比较的方法。一般地说,比较的变量越多,样本越可靠。
58、 概率抽样(北大93<简>:试说明概率(随机)抽样得主要方法;人大97<简>:简述概率抽样的随机化原则;吉大2000<简>:
简述概率抽样的类型及特点):(1)概率抽样:是总体中每一个体都有一个已知不为零的被选机会进入样本。概率抽样分为等概率抽样(随机抽样)和不等概率抽样。(2)简单随机抽样(纯随机抽样):是一种特殊的等概率抽样方法,总体中每一个体均有同等被选机会,而且样本中每一个体是被单独的选出的。它是一种元素抽样。分重复抽样和不重复抽样。(3)随机数字表(南开2000<简>:利用随机数表抽样的基本程序是什么? ):随机数字表是由数字0-9组成的表,由电子计算机编制而成。下面举例说明如何用随机数字表进行抽样:假定研究总体N=528,即总体中有528个个体,我们欲抽选一个由10个个体组成的样本,因为N是个三位数,因此首先从表中的50列数字中随机抽取三列,例如我们选中了第25-27列,然后由上到下从这三列中选出头10个001-528之间的不同的数,当然,不一定非要从这三列的第一行数字开始,可以从任意行开始,直到抽够10个数字为止。如果从这三列抽出的符合要求的数字不足时,就要另外随机抽取三列,从中继续抽取。如果N是四位数,则抽样时首先从表中的50列中抽取四列,再依上法抽出样本。(4)分层抽样(北大96<简>:说明分层抽样与定额抽样的特点及区别;北大97<简>:分层抽样与整群抽样的分类原则有何不同?为什么?北大98<简>:分层抽样与配额抽样有何异同?浙大99、2000<名>;南大2000<名>;人大02名,08论述什么是配额抽样?什么是分层抽样?举例说明这两种方法的实施步骤。这两种还有什么区别?):分层抽样就是先将总体按一种或几种特征分为几个子总体(类、群),每一个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起,即为总体的样本,称为分层样本。<1>分层抽样的优点:(A)当一个总体其内部分层明显时,分层抽样能够克服简单随机抽样的缺点。由于它是按群体的特征分布从不同层获得尽可能均衡的样本数,使样本与总体更相似。(B)分层抽样可以提高总体参数估计的精确度。由于它可以将一个内部差异很大的总体分成一些内部比较相似的子总体,从而每一个子总体内抽出一个小样本就能较好的代表总体。(C)有些研究不仅要了解总体的情形,而且还要了解某些类别的情形,分层抽样可(5)系统抽样(或等距抽样,机械抽样)(复旦98<名>;南大94<简>:等距抽样的基本步骤;南大<简>:等距随机抽样的抽样方法;人大04名):<1>系统抽样是简单随机抽样的一个变种,具体做法是:(A)将总体的所有个体前后排列起来。(B)计算抽样距离。抽样距离K=N/n(N为总体包含个体数;n为样本所含个体数);(C)在头K个个体中,用完全随机的方式抽取一个个体,设其所在的位置的序号是k。(D)自k开始,每隔K个个体抽取一个个体,即陆续抽取的个体所在位置序号为k,k+K,k+2K…k+(n-1)K。<2>系统抽样的优点:(A)与简单随机抽样相比,更易实施,工作量较少;(B)样本在总体中的分布更平均,故而抽样误差小于或至少等于简单随机抽样,即较其更精确。(C)系统抽样可看成是分层抽样,它等于将总体分为几层,每
第 14 页 共 49 页
14
以同时满足这两个要求,因为我们可以将每一类看作一个总体。(D)便于行政管理。
[键入文字]
K 个分子为一层,也就是说可以看作是每层只抽一个个体的分层抽样。两者不同的是,系统抽样的样本个体在每一层的相对应位置上,而分层抽样则是由每层随机抽取的。系统抽样在总体中分布更均匀,精确度较分层抽样更好。<3>系统抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,就会使系统抽样产生很大误差,降低样本的代表性。 <4>系统抽样适用于同质性较高的群体。当总体内不同类别之间所含个体的数目相差过于悬殊时,采用此法样本的代表性可能较差。这种情况一般使用分层抽样。(6)整群抽样(聚类抽样)(北大94<简>:试述分层抽样、整群抽样的抽样误差的来源,及他们对这两种抽样分层原则的影响):整群抽样是将总体按某种标准划分为一些子群体,每一个子群为一个抽样单位,用随机的方法从中抽若干子群,将抽出的子群中所有个体合起来作为总体的样本。<1>整群抽样与分层抽样异同:(A)它们在第一步都是根据某种标准将总体分为一些小群(B)但两者的抽样方式不同。分层抽样中所有子群均要抽取一个子样本,作为总体样本的一部分,即总体样本在各层中均有分布。而整群抽样则不然,它是抽取若个子群并将抽出子群的全部个体和起来作为样本,因此,总体样本分布在部分子群中。(C)由于抽样方式的不同,导致两者间划分子群的原则也不同。在分层抽样中,层的划分依据的是层之间异质性高,层内则尽可能同质的原则。整群抽样因仅抽取某几个子群作为整体的代表,如果子群间差异显著,且每个子群内同质性很高,那么这种情况下抽取的几个子群显然无法代表总体。因此,整群抽样得分群原则应与分层抽样不同,它是使得群体间异质性低,群内异质性高,因此,分层抽样适用于界质分明的群体,而整群抽样适用于界质不清的总体。<2>整群抽样的优点:(A)它可以通过转换抽样单位扩大抽样的应用范围;(B)它可以节省人财物力;(C)许多调查往往很难得到总体的所有个体的可靠名单,有时即使可以得到,所需费用也十分昂贵,这就限制了抽样的应用范围。这种情况下,使用整群抽样获得抽样框就容易得多。(D)整群抽样通过将抽样单位由个人转换成群体,使由简单随机抽样和分层抽样所不能进行的抽样调查成为可能 ,扩大了抽样的应用范围。<3>整群抽样的缺点:(A)样本分布不均匀,样本的代表性较差,与其他抽样方法相比,相同样本数,抽样误差较大;(B)分析整群样本的资料,如抽样误差,统计推断,假设检验要比前面几种抽样方法复杂;<4>分类:分为等规模整群抽样和不等规模整群抽样,前者总体内所有的群规模都相等,而后者总体内各群大小不一,这种情况下,往往出现样本规模随机变动的问题,为了解决此问题,往往采用子抽样的方法,即从抽出的样本群中再抽一次样,得到所需样本。(7)多阶段抽样(多级抽样):在整群抽样中,当子群数或子群内部个体数目较多,彼此间的差异不太大时,常采用更经济方法,即不将样本子群中的所有个体作为样本,而是再从中用前述各种随机抽样的方法抽取样本,因而最终样本的获得经过两次抽样,我们称其为二阶段整群抽样,同样可做三阶段、四阶段…即多阶段整群抽样。对于群体规模不等的多阶段整群抽样,通常使用概率比例抽样法:是根据每一群的规模分配样本容量。在将总体划分成子群时,每个子群中个体的含量常常不同,在这种情况下,二阶段抽样由于第一次抽取子群大小不同,只有在第二阶段抽样时采取措施,才能使总体中每个分子具有同等进入样本的概率。多阶段抽样的特点:多阶段抽样通过采用由高级抽样单位过渡到低级抽样单位的方法,解决了低级抽样单位不易获得的抽样框的问题,并且可以使样本的分布较为集中,从而大大降低调查所费人财物力。此外,多阶段抽样由于在各阶段抽样时可根据具体情况灵活选用不同抽样方法,故能综合各种抽样方法的优点,提高样本质量。因此,它特别适用于调查范围大、单位多、情况复杂的调查对象。多阶段抽样由于每阶段抽样都会产生误差,因此经多阶段抽样得到的样本的误差也相应增加,这是它的不足。
59、 非概率抽样(人大96<名>):(1)非概率抽样是根据研究任务的要求和对调查对象的分析,主观地、有意识地在研究对象的总体中进行选择,因此每个个体进入样本的概率是未知的,而且由于排除不了调查者的主观影响,因而无法说明样本是否重现了总体的结构,用这样的样本推论总体是极不可靠的。(2)偶遇抽样(方便抽样):是指研究者将在一定时间、一定环境里所能遇见到或接触到的人均选入样本的方法。优点是方便省力,但样本代表性差,有很大偶然性。(3)主观抽样(判断抽样,立意抽样)(南大98<名>):主观抽样中的“主观”有两种含义:<1>主观判断的意思,这时,主观抽样又称为立意抽样或判断抽样,即研究者依据主观判断选取可以代表总体的个体作为样本;<2>第二种含义是有目的地选择样本的意思。(4)定额抽样(配额抽样)(北大96<简>:说明分层抽样与定额抽样的特点及区别;北大98<简>:分层抽样与配额抽样有何异同?北大2003<名>;南大95、96、97、99<名>;人大08论述什么是配额抽样?什么是分层抽样?举例说明这两种方法的实施步骤。这两种还有什么区别?):它与分层抽样中的比例抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分为若干类或层,然后在各层中抽样,样本中各层(类)所占比例与他们在总体中所占比例一样,但不同的是,分层抽样中各层样本是随机抽取的,而定额抽样中各层样本是非随机抽取的。定额抽样是以代表总体为目的的,因此它必须对总体的性质有充分的了解,定额抽样假定:<1>只要类型划分较细,那么同一类型中的每一个个体都是同质的,因而无需采用随机抽样。<2>只要类型划分合理,而且分配给各类的名额符合总体中各类人员的分布,那么样本就可以准确地反映总体。(5)滚雪球抽样(北大92、93<名>):是先从几个适合的调查对象开始,然后通过他们得到更多的调查对象,这样一步步扩大样本范围。当调查总体的个体信息不充分时,常采用此种方法。但是,用这种方法抽样最后仍有许多个体无法找到,还有些个体因某些愿意被提供者故意漏掉不提,这两者都可能具有某些值得注意的性质,因而可能产生偏误。(6)空间抽样:是针对一个变动的总体,如游行队伍、集会等进行抽样的方法,这种总体虽然是第 15 页 共 49 页
15