? 2)显著性水平
? 假设检验是建立在概率理论原理的基础上的,通过检验拒绝那种在一次抽样的
研究中出现小概率事件的不可能的虚无错误。通常把概率小于0.05或0.01的事件称为“小概率事件”,这个概率也称为显著性水平。
? 显著性水平是指统计假设检验中拒绝原假设的小概率值。如果以0.05的显著性
水平进行假设检验,则概率值等于或小于0.05时说明差异显著,就拒绝原假设;若概率值大于0.05,说明差异不显著,则接受原假设。显著性水平也说明统计推断时可能犯错误的概率。若为0.05或0.01,表明统计推断犯错误的概率为仅5%或1%。
? 3)假设检验的基本步骤 假设检验一般有以下几个步骤: ? 第一步:建立虚无假设H0和备择假设H1; ? 第二步:确定检验形式(双侧检验或单侧检验);
? 第三步:选择适当的显著性水平,并根据检验类型查出临界值; ? 第四步:根据样本数据计算统计检验值; ? 第五步:比较临界值与统计检验值;
? 第六步:根据比较结果进行决策。一般在显著性水平下,临界值大于统计值,
差异不显著,则接受虚无假设H0,拒绝备择假设H1;若临界值小于统计值,则拒绝虚无假设H0,接受备择假设H1。
? 4)常用检验方法 在科学研究中,常遇到平均数显著性和平均数差异的显著性检验,相关系数的显著性检验等。其中运用较多的Z检验和t检验。 四、假设检验1.均值检验? 单总体或独立总体检验解释如下: ?正态总体方差已知? ?H0:?=?0H1:???0Z?Z?拒绝H0(双侧)??2? x-?0??Z=?H0:?=?0H1:???0Z?Z?拒绝H0(单侧)? ?/n?H:?=?H:???Z??Z拒绝H(单侧)?010?0?0?? ?正态总体方差未知?(单总体)?
?H0:?=?0H1:???0t?t?拒绝H0(双侧)?(n?1)?2? x-??0?t=?H0:?=?0H1:???0t?t?(n?1)拒绝H0(单侧)?s/n?
?H0:?=?0H1:???0t??t?(n?1)拒绝H0(单侧)??? ?若方差未知:??s?非正态总体n?30,同正态总体方差已知,??
? 上面所讲的总体平均数的显著性检验是对一个样本平均数与总体平均数的差异
进行显著性检验。而平均数差异的显著性检验则讨论的是两个样本平均数差异的假设检验问题。这种检验的目的在于由样本平均数之间的差异来检验各自代表的两个总体之间的差异。在进行平均数差异显著性检验时,要考虑到总体分布状态、总体标准差是否已知、样本之间是相关还是独立、样本容量的大小等问题,在不同的条件下需采用不同的检验方法。 ? 双总体检验可以推断两个总体的差异,解释如下:
2.均值之差检验个正态总体方差已知?两??H0:?1=?2H1:?1??2Z?Z?拒绝H0(双侧)??2??Z=x1?x2??1=?2H1:?1??2Z?Z?拒绝H0(单侧)?H0:22??1?2?H:=?2H1:?1??2Z??Z?拒绝H0(单侧)+??0?1nn12???个正态总体方差未知但相等?两??H0:?1=?2H1:?1??2t?t?拒绝H0(双侧)(双总体)?(n?1)?2??t=x1?x2??1=?2H1:?1??2t?t?(n?1)拒绝H0(单侧)?H0:?11?Sp+?H:?1=?2H1:?1??2t??t?(n?1)拒绝H0(单侧)nn2?01???22(n1?1)S1?(n2?1)S2?S=p?n1?n2?2?2?个非正态总体n,n2大,同两个正态总体方差已知,未知用S1,S2计?两12估
? 3.实验设计辅助统计
? 包括被试的取样方法和样本容量确定、实验条件的控制以及结果统计方法的选
择和设计等内容,一般是在实际研究开始之前进行的,目的在于使研究者能科学地、经济地以及更有效地进行实验。
? 上述所讲的三方面之间是密切联系的。描述统计是推论统计的基础,推论统计
是带有预测性质的统计分析方法;描述统计只对数据进行一般特征的描述分析,若不进行进一步的推论统计分析,就不能深刻地揭示统计结果的意义。描述与推论统计是在良好的实验设计下获得的数据基础上进行的。因此,实验设计的优劣是决定统计分析成功与否的关键。 ? 二、社会网络分析(SNA)
社会网络研究发端于20世纪20、30年代英国人类学的研究,其基本事实是每个行动者都与其他行动者有或多或少的关系,社会网络分析就是要建立这些关系的模型,力图描述群体关系的结构,研究这种结构对群体功能或者群体内部个体的影响。
? (一)社会网络分析原理
? 韦尔曼指出,作为一种研究社会结构的基本方法,社会网络分析具有如下基本
原理:
? 1.关系纽带经常是不对称地相互作用着的,在内容和强度上都有所不同。 ? 2.关系纽带间接或直接地把网络成员连接在一起;故必须在更大的网络结构
背景中对其加以分析。
? 3.社会纽带结构产生了非随机的网络,因而形成了网络群(network
clusters)、网络界限和交叉关联。
? 4.交叉关联把网络群以及个体联系在一起。
? 5.不对称的纽带和复杂网络使稀缺资源的分配不平等。 ? 6.网络产生了以获取稀缺资源为目的的合作和竞争行为。 ? (二)社会网络分析的操作步骤
? 1.定义研究问题及研究焦点2.确定分析单元,并确定网络边界和关系维度3.研
究工具的选择与开发4.进入研究现场收集关系数据5.建立关系矩阵6.数据处理与分析(如图6-12)7.解释分析结果8.撰写研究报告
? 第四节 计算机在统计分析中的应用
? 一般的计算机中都有许多备用统计程序,可以简便地进行各种统计运算。如平
均数、标准差、相关系数、t检验、方差分析、多元回归分析和各种非参数分析等。
? 运用计算机进行统计分析有很多优点。运算速度极快,运算量也很大,而且精
确性很高。统计软件包的功能齐全,容易掌握和操作,使用十分方便。 ? 一、计算机统计分析的基本步骤
? 计算机统计分析的基本过程可用下图表示。(图6-13)
? (一)数据的组织
? 在数据输入计算机之前必须对数据进行组织。若数据没有得到很好的组织,将
很难进行分析。数据的组织实际上就是数据库结构的建立。
? 数据组织的第一步是编码,即用数字代表分类数据。如被试性别1=男性,2=
女性。如不同的班级,实验组与对照组等等。区间数据和比率数据有时也需转换成类别数据并进行编码。如家庭人均收入状况分组、不同的智商水平分组都要进行编码。
? 编码完毕后,一般应复核一遍,改正编码误差。
? 第二步是给变量赋值,即设置变量并将根据研究给予其数字代码。一般的计算
机系统每行的最大容量为80个字位,需要给予每个变量以足够的编码宽度。一般编码宽度以可能的最大长度而定。如被试数目小于100,则需要从01开始用两个字位的空间表示被试编号。被试变量最开始的几个字位通常是被试识别码。被试识别码一般包括被试编号、性别、专业等特征。总之,在进行统计分析之前,研究者对数据进行组织。研究者需要一份变量表,以说明变量及其相应代码所在的字位位置。(表6-12)
? 表6-12 变量表例举 ? 字位 变量名 数据类型 ? 1-4 NO(被试编号) 数字 ? 5 SEX(被试性别) 字符 ? 6-7 AGE(被试年龄) 数字 ? 8 L(是否团员) 逻辑 ? 9-11 IQ(智商) 数字 ? 12-13 MS(数学成绩) 数字 (二)数据的录入
数据的录入就是将编码数据输入计算机,也就是输入已经建立的数据库结构中,形成数据库。由于目前数据的录入大多是通过计算机键盘进行的,又称为数据的键入或输入。等对录入的数据进行检验后,就可以对数据进行统计分析。
? (三)统计分析
? 数据库建立起来后,就可对其进行统计分析。
? 研究中最常用到的计算机软件是SPSS,它是社会科学用统计软件包的缩写
(Statistical Package for the Social Science)。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。
? SPSS的统计分析过程包括描述性统计、均值比较、一般线性模型、因素分析、
回归分析、聚类分析等几大类。
? 本课程就SPSS软件包的运用作以简单介绍。一、SPSS的窗口简介 ? SPSS主界面主要有两个,一个是数据编辑窗口,另一个是输出窗口。 ? (一)数据编辑窗口 数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量
名栏、内容区、窗口切换标签页和状态栏组成,见下图6-14。
菜单栏 标题栏 编辑栏 变量名栏 状态栏 窗口切换标签工具栏 内容区
? 1.菜单介绍
? File:“文件”菜单用于新建SPSS 各种类型文件,打开一个已存在的文件,从文本文件或其它数据源读入数据。
? Edit:“编辑”菜单用于撤消操作、剪切、复制、粘贴、查找、改变SPSS 默认设置等。