袁方 社会学研究方法教程(6)

2019-03-16 22:21

[键入文字]

关设计缺点:<1>由于对个试验对象没采取控制,所以无法排除其他变量的影响,因而,他的内在效度较低。<2>相关设计的另一缺点是缺少前测,无法进行时间序列的比较。解决这一缺陷的一种方法是,增加一个事后回溯设计,即在引入试验刺激并加以(4)时间序列设计(北大2002<名>):也称趋势研究,一般用于研究较长时期内人们的态度和价值观念的变化。是对相关设计的扩充,它也是一种交互分类设计,不过,它的前测和后测包括多个时点,由此组成一个较长时间序列的观测值,从这些因变量的变化趋势中可以发现自变量的影响程度和影响过程。时间序列设计有多个观察点,而且在每一时点都对试验组和控制组加以测量,因此,从它的差异可以发现因变量的变化趋势,由此可以预测未来的发展变化,并在实际发展过程中检验这种预测。时间序列设计的缺点:(1)无法判定所假设的自变量是否对因变量由主要影响,因为在很长的时期内,会有许多其他因素导致因变量的变化。(2)测量态度和价值观的变化是很困难的,由于趋势研究是要不断的观测社会发展变化和新的社会现象,它很难利用现有的量表和标准问卷,因此无法确定测量工具的效度。(5)非等组前后测设计:这种设计的形式与典型设计相似,但是,它的试验组与控制组是不等同的。其优点:<1>不仅可以得到后测的差异,而且还可以知道前测的差异。<2>可以得到更多的信息。 其缺点是:由于两组是不等同的,因此无法推论x与y的因果关系,因为y的变化很有可能是不同的试验对象所固有的,没有控制实(6)现场试验设计:准实验一般都是在自然环境中进行的,研究人员虽然不能对自然场所的变量加以严密的控制,而且很难采用随机抽样方法是试验组和控制组完全保持一致,但他们可以结合研究目的对试验变量和现场环境加以一定的控制,这种实验也称为实地实验或现场试验。其特点是:隐蔽性、真实性和概括性都较高。因此,具有较高的实用性。其缺点:对实验变量和外部变量缺乏严格的控制。为了弥补这一缺陷,应当尽可能的在相似状况下重复同一项实验,以提高实验的效度和信度。(7)准实验与纯实验在原理上没有严格的区别,准试验只是由于现场和研究条件的局限不得不将纯试验设计加以简化。当然,当条件许可时,应尽可能采取交严格的试验设计,以提高实验的效度。但是,目前社会学试验大部分还不具备采用严格设计的条件,他们通常只能成为准试验,而在纯试验设计或实验室研究中,大多是研究社会心理学和教育学的课题。准实验和纯实验均有其优缺点和局限性。此外,在多种形式的实验设计之间,也没有绝对的优劣之分,他们都适用于某些特定的研究目的和研究领域,研究人员应依据研究目的之要求来选择最适当的实验设计。 101、

实验的信度和效度:(1)信度:与其他搜集资料的方法相比,实验法的信度和内在效度较高。对信度的检查一般是

通过重复试验的方法,观测实验的前测和后测也可以检验信度。另一种方法是在多组设计的情况下,通过各个组在同一次试验中的差异来检验信度。(2)效度:实验目的是检验变量间的因果关系,并使实验结果具有概括性。但这两个目的是很难同时达到的,要精确测量自变量的影响,就要严格控制情景和外部变量,但这会使实验环境人工化并缺乏代表性,从而降低外在效度,而如果提高情景的真实性和样本的异质性以使实验能概括广泛的现象,则很难控制其他外部因素的影响,因而降低了内在效度。大部分试验设计都面临着这两种困境,若提高内在效度则有可能降低外在效度,或者相反。这也是纯试验与准试验的不同之处,前者内在效度较高,外在效度较低,后者则相反。影响外在效度的因素主要是:<1>实验情景的人工化;<2>实验样本缺乏代表性。影响内在效度的因素主要是:<1>社会现象和社会行为的因果关系很复杂,影响因素很多,对这些变量很难实施控制。<2>对社会因素很难明确界定和测量。为了提高内在效度,我们可以从以下方面来考虑各种危害实验内在效度的问题,并尽可能减少和控制他们的潜在影响。<1>有关实验对象方面的问题:(A)对象选择:即用来进行比较的两个群体之间是否本身存在差异。(B)对象的丧失:即是否所有的对象都一直在研究中。(C)实验与控制组的竞争。<2>有关试验程序的问题:(A)测量的影响。(B)器械操作。(C)实验处理的模仿。<3>有关时间的问题:(A)成熟的影响。(B)历史的影响。 102、

实验法的优点和缺点:(1)实验法的优点:<1>能够确立因果关系。<2>花费较少。<3>易于重复。<4>控制能力强。

(2)实验法的缺点:<1>缺乏“现实性”。实验室中的社会过程往往也不能代表现实世界中的社会过程。<2>样本的缺陷。实验结论所依据的那些实验现象与现实世界中的人们往往大不相同。<3>实验人员的影响。<4>伦理及法律上的限制(人大97<简>:简述实验方法中的社会伦理问题):由于社会研究的对象是人,因而实验所能操纵的自变量常常受到现实生活中伦理或法律的限制。比如,我们不能为了进行有关人口密度和侵犯行为间关系的实验,而让众多的实验对象长时间禁闭在拥挤的室内,也不可能让他们之间发生各种暴力侵犯的行为。

第十三章:文献法

103、

文献法(南大2000<简>:通过分析历史文献,可以建立社会骚乱、经济衰滞、政治腐败之间的关系。请给出一例):

在严格意义上文献法并不是一种资料收集方法,而是一种研究方式---------即既包括资料的收集方法也包括对这些资料的分析方

第 26 页 共 49 页

26

后测之后,在询问被试者过去的状况。以此与因变量的后测值比较。

验对象的固有特征就不能检验出x的真正影响,最多只能说明所假设的自变量与因变量之间存在着相关关系。

[键入文字]

法。它不是直接从研究对象,即人那里获取研究所需要的资料,而是去收集和分析现存的、以文字形式为主的文献资料。 104、

文献的类别及来源:(1)文献:指的是包含我们希望加以研究的现象的任何信息形式。(2)类别:根据文献具体来

源的不同,分为个人文献(主要指个人的日记、信件、回忆录及自传等)、官方文献(主要指政府机构和有关组织的记录、报告、统计、计划、信函等)及大众传播媒介(主要指报刊、电影、电视等)三大类。也可以分为原始文献(或第一手文献。指的是有亲身经历某一事件或行为的人所写的资料)和第二手文献(文献学上称二次文献。是利用别人的原始文献所编写或产生出的新的文献资料)两大类。 (3)利用官方统计资料应注意:<1>应该对统计资料的内容、对象、范围、特点等等都具有清楚明确的认识。<2>对于各种统计指标、比率和数字的实际含义、他们的计算方法等等应十分清楚,不能含糊。否则就会出现错用资料的情况。 (4)历史文献:往往是指那些再形成的时间上举目前较远并且文献的作者以及所记述的时间和运动的当事人都已去世的资料。在通常情况下,历史文献更多的为历史学家所运用。 105、

第二手分析(人大06名):(1)定义:也称二手分析,指的是对那些由其他人原先为别的目的收集和分析过的资料

所进行的新的分析。<1>一种是从别人为研究某一问题而收集的资料中,分析与该问题所不同的新的问题。即把同一种资料(已有的,别人的研究所收集的资料)用于对不同的问题的分析和研究中。<2>另一种类型则是用新的方法和技术去分析别人的资料,以对别人的研究结果进行检验。即用不同的分析方法处理同一种资料,看看是否能得出同样的结论。(2)第二手分析的步骤:<1>选择研究主题:适用于第二手分析的主题可以使相当大的,它有时仅仅只能采用那种在一个国家规模上所得到的数据资料。通常,在研究设计中,要留有一定余地,以便一旦发现相关的资料中并不具备你所想要得各种特征时,就可以稍微修改你的研究设计,以保证与可用资料的一致性。在主题与资料的关系上,第二手分析往往要求主题去适应资料,而不是相反。这主要是因为数据资料是已定的,无法变动的,研究者只能在处理和分析资料的方法上、技术上动脑筋。而研究主题则是可以随时调整的。<2>寻找合适的资料。最好的途径是阅读一份相关的研究。当发现一组对你似乎十分有吸引力的数据资料时,你可以仔细地阅读论文的资料部分对资料的内容、收集方法等等的描述。如果是在一本著作中发现这组资料的,那么,书中一般都有介绍资料的收集方法和过程的专门章节。此外,在书后的附录中,还可以找到诸如问卷、指数计算方法等详细的信息。<3>对资料的再创造。首先,必须从资料中寻找或重新定义所要研究的变量。其次,应该仔细地研究这些变量。最后,你也可以掷去样本中的一部分作为分析的对象。<4>分析资料。第二手分析的最主要也是最大量的工作,就是对资料的重新分析。 (3)第二手分析的优点:<1>省时省钱又省力。<2>特别适合于比较研究和趋势研究。(4)第二手分析的缺点:其缺点主要在于资料的准确性和适用性。某个研究者为其特殊的目的所收集的数据资料不一定与另一研究者的研究旨趣相符;而二手分析研究这所需要的资料有可能完全搞不到。实际上,这样的资料对于第二手分析研究人员来说,效度是较低的。即原始问题所测量的并不是二手分析研究这所希望测量的变量。 106、

内容分析(人大97<名>;南大97<名>):是这样一种研究技术,它对各种信息交流形式的明显内容进行客观的、系

统的和定量的描述。所谓“各种信息交流形式”指的是各种书面材料、宣传品和艺术品。所谓“明显的”是指这些形式外在的东西。“进行客观的、系统的”描述,意味着内容分析是一种规范的方法。它要求研究这根据预先决定的计划,采取一定的规则,按照一定的步骤来进行。而“定量的”描述则说明内容分析方法的基本性质。它意味着,在内容分析中,其主要目标通常是决定内容中某一项目的频数,或者决定某一类别在整个内容中所占的比例等。此外,还对这些定量的结果进行分析。(1)内容分析的步骤:<1>抽样:通过抽取有代表性的样本的方法,来达到研究全部对象的目的。<1>编录:即根据特定的概念框架,对信息-----无论是口头的、文字的、画面的或是其他形式的------作分类记录。与编录有关的问题有两个:(A)选择编录单位:即选择具体的观察和点算单位。要注意把它与分析单位加以区别。(B)制定一份编录单:编录单是对文献材料进行观察和记录的工具,在某种程度上,它同结构式观察所用的记录但十分相似。它的形成和结构将主要依赖于编录单位的选择。一旦选定了编录单位,研究这就要为他们制定和赋予数值。分类的基本要求是要满足互斥性和穷尽性。 (2)内容分析的类型(?北大2000<简>:简述比较研究法的主要类型):<1>计词法:是内容分析中最简单、最常用的方法。这种方法是,首先确定与研究问题有关的关键词(记录单位),然后统计这些关键词在各个样本(分析单位)中出现的频数和百分比,最后进行比较。<2>概念组分析:有时,使用主题作为记录单位不易划定主题的界限。此时,可以利用概念组分析。它是将与研究内容有关的关键词分成小组。每组代表一个概念,同时也是理论假设中的一个变量。这种方法记录的单位仍然是单词,但分析时的变量却是概念组。<1>语义强度分析:首先是给出词汇的“强度权”,已显示他们在使用时的差别。强度权是由词汇的语义所决定的,如“爱”比“喜欢”的加权数高。(3)内容分析的优点:<1>省钱省时。<2>保险系数大。<3>允许我们研究在一个长时期中所发生的过程。<4>是一种非干扰性的研究方法,不会打扰我们的研究对象,不会对这些研究对象发生影响。(4)内容分析的缺点:<1>只局限于对记录下来的信息进行分析和研究。<2>资料的效度也存在一定的问题。

第 27 页 共 49 页

27

[键入文字]

107、

现存统计资料分析:(1)步骤:<1>选择合适的资料。许多研究常常要求大量的聚集资料与此相适应。<2>处理资料。

我们通常所能做的,是比较那些基于较小的单位。<3>说明资料来源。以使得这种资料能够被理解。否则别人就会对你的证据的可靠性和准确性产生怀疑。(2)效度和信度:逻辑推理和重复验证这两条科学的原则,对于保证现存统计资料分析的消毒来说是极其重要的。现存统计资料的信度在很大程度上依赖于统计资料本身的质量。 108、

文献法(南大98<简>:文献分析法与闻讯方法相比有那些突出的特点):(1)文献法的优点:<1>具有无反应性的优

点。<2>费用较低。<3>可以研究那些无法接触的研究对象。<4>适于作纵贯分析。(2)文献法的缺点:<1>许多文献的质量往往难以保证。<2>资料不易获得。<3>许多文献资料由于缺乏标准化的形式,因而难于编录和分析。

第十四章:资料整理

109、

资料分析(复旦96<简>:理性分析与统计分析有什么关系与区别):资料分析不仅决定着收集到的资料是否有价值,

而且能够很好的检验假设和理论,或者适当地回答所研究的问题,还能够以可以理解和令人信服的形式描述研究成果。通过分析,研究者可以将认识从具体提高到抽象、从个别提高到一般,并可从中发现新问题、提出新假设,将研究引向深入。在某种意义上来说,分析的水平决定着整个研究的水平。(1)社会统计学:是有关社会资料收集、整理、分析和推论的一整套方法,它不仅包含全部抽样理论、统计检验理论和大部分的社会测量法,而且使分析技术获得极大的发展,主要是多元统计方法的发展,如路径分析、因素分析等。 110、 111、

资料整理:就是对收集到的原始资料进行检查、分类和简化,使之系统化、条理化,以为进一步分析提供条件的过定性资料的整理:(1)资料的审查:目的是消除原始资料中的虚假、差错、短缺、余冗等现象,以保证资料真实、

程。因此,资料整理既是资料收集工作的继续,又是资料分析的前提。

可信、有效、完整、合格,从而为进一步整理分析打下基础。对定性资料的审查主要集中在真实性、准确性和适用性上。<1>真实性审查:也称信度审查,即看资料是否真实可靠的反映了调查对象的客观情况。方法:(A)根据已有的经验和常识进行判断。(B)根据材料的内在逻辑进行核查。(C)利用资料间的比较进行审核。(D)根据资料的来源进行判断。<2>准确性审查:也就是效度检查,一方面是审查收集到的资料符合原设计要求及对于分析所研究的问题有效用的程度。另一方面是审查资料对于事实的描述是否准确,特别是有关的事件、人物、时间、地点、数字等要准确无误,切忌事实资料含混不清,模棱两可,数据资料笼统模糊。<3>适用性审查,也就是考察资料是否适合分析与解释。主要包括:资料的分量是否合适、资料的深度与广度如何、资料是否集中紧凑是否完整等。<4>对于文献资料的分析评价,首先是进行所谓的“外在批判”,即审查:是在什么地方、什么时间、什么人、为什么目的、用什么方法编写这些文献的。<5>还要进行“内在的批判”,即了解资料的编写者表达的什么内容,在什么条件下编写这些资料,内在批判要注意:(A)对作者适用的词,特别是多义词,价值语进行反复的推敲。(B)在文笔的表现上特别要区分“事实”和“对事实的解释与推论”。(C)要进行多方面的研究,看作者是否真实的反映了客观事实,资料的叙述是否正确,有无夸张扭曲,或偏执于一家之言;叙述是否准确,叙述者写作上的表现能力如何等。<6>实地审查:是在搜集资料的过程中进行的,边搜集边审查。<7>系统审查:是在资料收集完毕后集中进行的审查。<8>测不准效应:指由于观察者的参与,改变了被观察对象的自然状态,被观察者或单位可能做出种种假象来掩饰事实的本来面目,使真实状态的测定不可能了。<9>棱镜效应:(2)资料的分类:分类是将资料分门别类,使繁杂的资料条理化系统化,为找出规律性的联系提供依据。<1>确定分类标准:分类的关键在于选择和确定分类标准。分类标准的选择往往是基于某种假设或理论,本身就是对所研究问题的一种分析和认识。分类标准可分为:(A)品质标准:就是反映事物属性差异的标准。例如性别、民族、企业所有制等。(B)数量标准:就是反映事物数量差异的标准。例如以人口作为划分大中小城市的标准。<2>确定分类标准的原则:(A)有效性原则:(a)这一分类方式对于研究目的是有效地。(b)这一分类能有效的反映现实社会现象。(c)为此,分类必须服从于研究目的,必须能反映现象的本质特征。(B)互斥性原则:指分类标准应当互斥,以使同一条资料只能归于一类。(C)完备性原则:指分类标准的确定应当使每一份资料都有所归属。(D)各类别必须处在同一分类层次。<3>资料分类的方法:(A)前分类:指收集资料前就已定下分类标准,然后按分类指标收集和整理资料。(B)后分类:指在资料收集完成后,在根据资料的性质、内容和特征分类。定量资料一般采用前分类,定性资料一般采用后分类。 <4>分类的功用:<1>指出社会现象或社会单位的类型。<2>反映总体的内部结构。<3>分析社会现象之间的依存关系。(3)资料的汇总和编辑:基本要求:<1>完整和系统;<2>简明集中;<3>拉扎斯菲尔德提出以下操作步骤:(A)定义对个案进行分类的标准。(B)决定在各个个案记录的指标中登载于这一分类标准上的项目或与这一分类有关的项目。(C)根据各指标在标准上的位置,给予数值和符号。(D)为了决定表示各个案位置的最终指数,要汇总各个案记录的

第 28 页 共 49 页

28

指社会现象的感知和解释都要通过观察者这面棱镜,通过它的价值标准和以往的经验再折射出来,从而使观察资料不准确。

[键入文字]

分数。 112、

定量资料的整理: (1)资料的审查:<1>完整性审查:(A)资料总体的完整性。(B)每份资料的完整性。<2>统

一性审查:首先是检查所有问卷、报表登记填报方法是否统一;其次要检查对同一指标的数字所使用的量度单位是否一致,以及不同表格对同一指标的计算方法是否统一等。对于统计资料的统一性审查包括:(A)审查指标的定义和分组的标准是否与自己研究的分类相一致。(B)审查指标统计总体范围是否一致。 <3>合格性审查:(A)提供资料者的身份是否符合所规定的调查对象的身份。(B)所提供的资料是否符合填报要求。(C)所提供的资料是否正确无误。方法:(a)判断检验。就是根据已知情况判断资料是否真实正确。(b)逻辑检验。即从资料的逻辑关系来检验其是否正确真实。(c)计算检验。通过各种数字运算来检验各项数字的正确性。<4>整个审查要经历三阶段:(A)由调查员进行审查。(B)有现场专职的检查员进行检查。(C)调查结束后(2)资料的分类和编码:<1>编码(复旦98<名>;人大04名):就是将文字资料转化为数字形式的过程。编码的目的使用一组变量表示各项调查问题,用每一变量的不同取值表示对这一问题的不同回答,从而使文字资料转化为数字形式。<2>编码步骤:(A)对回答进行分类。(B)建立回答类别与变量数值之间的对应关系。(C)注意:(a)对于开放性问题,因实现不能预料到答案的情况,故无法在设计问卷时事先分类,这时,编码就要从对问题的回答进行分类开始。(b)一般的讲,开始时分类可细一些,当分析不要求过细的分类时可以将某些类别进行合并。分类的多少还要考虑统计分析方面的问题。(c)任何调查都不免有一些回答这对一个问题不做任何回答的情况,为此对问卷中的每个提问要增加一个无回答编码。对无回答编码的原则是明确区分无回答与其他回答,通常的习惯是用9或几个9来代表无回答。对无回答的项目,不能一概简单地认为是缺失数值或回答率低。统计缺失数据时,应结合回答人的情况分析。如行政人员不回答“技术职称”是正常的。<3>编码项目:问卷编号、问卷所属区域或部门、其他要进行统计的分类标准。<4>编码方法:(A)预编码:方法是在设计问卷时对回答的每一个种类都指定好其编码值,并印在问卷上。预编码主要限于回答类别事先已知的问题,这些问题主要是封闭性问题,或回答已经是数字而不需要做转换的问题。优点:处理资料时比较简单,省时省力。缺点:无法用于开放性回答,因为我们无法事先知道回答的种类。(B)后编码(南大2000<名>):是指对问卷的编码过程是在问卷回收之后进行的,而不是与问卷设计同时进行的,多用于对开放性问题的编码。比较费时费力。(C)边缘编码:实际上是一种预编码方法,它与一般预编码的不同之处在于,这种方法不仅指定了编码值,而且给出了每个项目记录回答的空间,现在应用得最多。边缘编码是在问卷上每个调查项目旁边的空白处标明填写编码的位置。问卷回收后,将每份问卷上的回答变成指定位置上的编码。(D)编码簿:用以指示每个编码的意义和变量的位置。作用是建立变量和调查内容、变量值与回答类别的一一对应关系。它可以(a)作为编码工作的指南。(b)使研究者在分析过程中便于查找变量及各种编码所代表的意义。(E)编码簿的主要项目:(a)问题号码。是在调查表或问卷上的问题的题号,有了题号就可以知道这一题目在资料卡片上的哪几列。(b)变量号码。有了变量号码,研究者可以知道变量的代号,方便分析计划的拟定,在分析时直接饮用变量号码而不必提及变量名称。(c)项目名称。又称变量名称,用概括性语言表明项目的含义。(d)编码的内容说明。即给出每一(3)资料的登录:<1>个案登录:即将各个调查对象的全部数据资料以编码的形式记录在一张张卡片上,即建立个案档案。<2>总体登录:即将所有调查对象的全部数据记录在一张资料卡片上,这种方法适用于为电子计算机处理作准备。(4)资料的汇总:就是根据研究目的,对分类后的各种数据进行计算和加总,汇集到有关的表格之中,以集中系统地反映调查资料总体内部的数量情况。汇总的目的:<1>初步了解数据的分布情况。<2>为编制次数分布表作准备。<3>为深入的统计分析作准备。<4>便于保存调查资料。 113、

计算机处理资料的一般过程。(1)输入前的准备:<1>资料的审查。<2>资料的分类与编码。<3>登录,即将问卷中

的回答转录到资料卡片上。一般将编码、登录与数据输入过程结合起来,为此,越来越多地采用也边编码的方式。(2)输入数据:指通过对计算机输入设备的操作,将资料卡片中的资料送入计算机贮存起来,以备调用。输入方式:<1>键盘输入;<2>卡片输入;<3>光电输入。(3)资料的净化(复旦98<简>:对录入的数据进行检查的主要方法):<1>幅度检查(北大99<名>):使用一个自编的简单程序或者已有的统计软件可以将某一变量的分布显示出来,这样就可以检查出一部分错误。例如,变量性别的取值只有两个-----1(男)、2(女),因此,5和8是违规数字。这样,我们首先了解到,性别这个变量的数据有错误。然后,我们可以变出一个程序列出含有性别变量的违规值的学生的编号,通过核对问卷,就可以知道这些违规值是如何出现的,以及如何修正了。<2>逻辑检查:利用变量之间的逻辑关系来净化资料。(4)数据的处理。

第十五章:资料的统计分析

第 29 页 共 49 页

29

由调查组织机关的检查员进行检查,重点是检查回答登记错误,计算错误及调查员是否对英调查对象均进行了调查,有无作弊等。

项目问题答案的分类以及分配给每一类别的数字。(e)列序号。即每一项目应当占哪几列。

[键入文字]

114、 115、

统计分析的作用:(1)可对资料进行简化和描述。(2)可对变量间的关系进行描述和深入地分析。(3)可通过样本统计分析的步骤:(1)对应用统计分析的前提条件进行考察。统计分析是建立在树立统计理论基础上的,因此他的

资料推断总体。

应用必须满足一定的理论前提。(2)制定统计分析方案:<1>再次确定自变量与因变量。<2>定义复合变量。问卷或调查表上出现的各个变量,一般称为基本变量或原始变量。用基本变量组合而成的新的变量,称作复合变量。<3>变量分组:将类别或属性相同的变量组合成有意义的数组。<4>提出统计计算的要求并提出适当的统计方法。(3)选择统计分析方法的原则。必须根据研究目的和资料本身的特点选择适当的统计分析方法。从研究目的考虑:是描述性研究还是解释性研究。描述性研究在于说明某种社会现象的状况;对于解释性研究,除了采用描述性研究的方法外,还要使用控制变量、建立因果统计模型和分类及综合变量等多种统计分析技术。研究资料的性质,主要考虑:<1>变量的测量尺度;<2>资料的收集方法;<3>数据的分布形态;<4>变量的个数。(4)对于统计结果的解释。统计分析是一种定量分析方法,但任何具体的两都是有质的规定性以及数量关系背后的社会背景情况,如果不了解这种质的规定性以及数量关系背后的社会背景情况,就可能做出肤浅、错误的甚至荒谬的解释。因此,对于统计结果的分析,有赖于对事物作深入地观察和了解,决不能凭表面的数据就轻易的下结论。 116、

单变量的统计描述:(人大04简答 怎样对不同尺度的单个变量做描述性统计分析)(1)变量的分布:<1>频次分

布:就是变量的每一取值出现的次数。对于连续性变量,如定距变量 ,频次的计算必须分组进行。其中每组上限即下一组的下限,通常将下限包括在本组中,每组用组中值表示。<2>频率分布:用变量每个取值的频次数除以总个案数,他是一个相对指标,派出了样本规模的影响,因而可以用来比较不同的样本。一般频率分布使用比率的形式表示的。(2)统计图与统计表。<1>统计表就是以表格形式来表示变量的分布。在制作统计表时,如果有未回答或回答不符合要求的情况,可以有两种处理方法:(A)仍以调查总数为基础计算频率,这时应加入一类:未详。(B)以有效回答为基数计算频率,这时应在表的下面、紧接着表的地方注明:未详****户。<2>统计图:是以图形表示变量的分布情况。统计图虽然不如统计表精确,但是更直观、生动、醒目。(A)圆瓣图:是用一个圆代表现象总体,每一瓣代表现象中的一类,其大小代表他在总体中所占的百分比频率。(B)条形图:多用于描述定类与定序变量的分布,他是以长条的高度表示变量不同取值的频率分布的,其中长条的宽度没有意义,一般均化成等宽长条。长条的排列可以使离散的,也可以使紧挨着的。(C)直方图(人大02、08名):是由紧挨着的长条构成的,与长条图不同的是,他的条的宽度是有意义的,实际上它不是用长条的高度而是用长条的面积表示频率的大小,长条的纵轴高度表示频率密度(频率密度=频率/组距),长条的宽度表示组距。直方图仅适用于定距变量。(D)折线图:是用直线连接直方图中条形顶端的中点而成的。当组距逐渐减小时,折线将逐渐变为平滑,趋向为曲线。(3)集中趋势分析:是从一组数据中抽象出的一个代表值,以代表现象的共性和一般水平。除可以说明某一社会现象在一定条件下数量的一般水平外;集中趋势还可以对不同空间的同类现象或同一现象在不同时间的状态进行比较;以及分析某些社会现象之间的依存关系。<1>众数Mo(北大92<问>:试用分布理论简述算术平均数、中位数和众数三者之间的关系):就是出现频率最高的变量值。众数可以适用于任何测量层次的变量,对于定类和定序变量,众数可直接从变量的频率分布中观察到;对于定距变量,如果变量是在第I组具有最高的频率密度,则用第I组的组中值表示变量的众数。<2>中位数Md:是将观察总数一分为二的变量值。若将数据从小到大顺序排列,则Md取值于(N+1)/2处的变量值。当N为偶数,由于(N+1)/2处无数值,取中间位置左右两数的平均值。对于经过分组的资料,中位数的位置则是通过计算累计百分比频率得到的。即首先计算出含有累积频率50%的区间,然后求出这个区间的上下限值(U、L)最后利用公式(参见教材)计算中位数值。中位数一般用于描述定序及定序以上的测量尺度的变量的集中趋势。<3>平均数:仅适用于定距及定距以上变量,但有时也可用于定序变量。如求平均等级。对于分组值,一般用组中值来代替变量值,然后加权平均计算平均数。需要指出的是,用组中值计算的加权平均数知是用原始数据计算的平均数的近似值。由于分组是人为的,所以在变量分布不均匀的情况下,不同的分组会有不同的结果。<4>分布与三值的关系:正态分布时,三值重合;偏态分布中,三值不重合,在正偏态时,由于左边频次密集,这使得中位数偏向左方,但由于右侧的变量取值大,故平均数叫中位数偏右,即平均数>中位数>众数;而在负偏态时则相反,有平均数<中位数<众数。(4)离中趋势分析:用以概括描述数据间差异程度的统计指标。与集中趋势相比,二者区别:<1>集中趋势描述的是现象的共性,而离中趋势描述的是现象的差异性,如果离中量数大,说明数据分布很分散,这时集中值对数据的代表性低;反之,则说明数据的分布很集中,集中值对数据的代表性高。<2>在由样本资料推论总体(5)常用的李中趋势测量指标:<1>异众比率:即非众数的各变量值得总频数在观察总数中的比例。可见,异众比率是对众数的补充,异众比率越小,说明众数的代表性越好。<2>极差:是对定序及定序以上尺度的变量离散程度的测量。它等于最大观察

第 30 页 共 49 页

30

时,集中值告诉我们的是如何去估计与预测总体,而离中趋势则告诉我们这一估计与预测的误差大小,因此,两者是互补的。


袁方 社会学研究方法教程(6).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:java中三大框架和项目模拟面试题目

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: