心理学实验笔记 2(3)

2019-02-20 21:35

2.系统误差有时在实验中还会出现另一种类型的误差,它的观测值不是分散在真值的两侧,而是有方向性和系统性的。所有重复实验的观测值大部分都会比真值偏高、或者偏低,其原因是存在有系统误差。 产生系统误差(systematicerror)的原因有很多,如可有仪器的故障,有时也要考虑实验环境如照明、温度、压力、湿度的变化对实验结果的影响,这时照明、温度、压力、湿度的变化就不能视为偶然因素了,而是系统误差因素。另外,在心理实验中,观测者本身的一些因素(如位置、练习、疲劳、时间等),也能产生系统误差。排除系统误差是实验成败的关键。 (二)集中量

对数据的概括了解,在统计学上常由二种量数来表示:

一为表示集中趋势(centraltendency)的集中量(或集中量数)(measureofcentralten-dency); 一为表示离中趋势(variation)的差异量(measureofvariation)。 常用的集中量有平均数、中数和众数。下面我们分别进行讨论。

1. 平均数一个物理量的真值是客观存在的,通常我们无法知道它的真值,而是通过测量或实验观测算出它的近似值。平均数(mean)或称算术平均数(mathematicmean)就是把一组数据加起来再用次数去除。它是刻画数据集中位置的极为重要的数。因此,平均数有两个意义:(1)对一组数据获得一个总的印象;(2)将此组数据和另一组数据进行比较。平均数是一个主要量数。 平均数用符号M表示,其计算公式为:(?)

假如所测原始数据较多,可以进行归组计算,则求平均数的公式为(?)

2.中数中数(或中位数、中点数)(median,简称Mdn)常用符号Md表示。中数是在按大小顺序排列的一组数据中,占中间位置的那个数。这个数可能是数据中的某一个,也可能不是原有数。中数是集中量数的一种,它能描述一组数据的典型情况,其特点是极少受极端数据影响。 单列数据的中数的计算方法十分简单:

如果个数为奇数,则取序列为第(n+1)/2的那个数据为中数。

如果数据为偶数,则取序列为第(n/2)或第(n/2+1)这二个数的平均数为中数。 假如数据较多,也可以进行归组计算。则求中数的公式为:?

(L:含有中数那一组的真实下限n:度量总数F:低于含有中数那一组的度量数 i:组距f:含中数那一组里的度量数)

3.众数众数(或密集数、通常数、范数)(mode,简称Mo)通常用符号M0表示。众数是在整个分数里次数最多的一个度量,在分组的次数分配上便是次数最多的一个组的中点。它也是一个集中量数,也可用来代表一组数据的集中趋势。众数计算起来很快,不论是分组的数据还是未分组的数据,都可用观察法来求众数

在数据整理成数据分布的过程中,同一数据由于分组组距的大小可变动,因此组距中点的数值也必随之而有改变,致使众数也有相当的移动。所以众数是不够稳定的,在比较结果时它只能用作约略的参考而已,因为众数受分组情况的不同而有所不同。

在心理学上,众数和平均数的差别能反映实验的难度。如果平均数大于众数,说明大多数人的度量结果低于平均数,可见在此实验中多数被试者存在低估的情况。反之,如果平均数小于众数,说明大多数人的度量结果高于平均数,可见在此实验中多数被试存在高估的情况。

在统计学上,众数和平均数之差可作为分配偏态(skewnessdistribution)的指标之一,如平均数 大于众数,称为正偏态(positiveskewness);相反,则称为负偏态(negativeskewness)。 一般而言,平均数和中数用得较多些。当没有极端数字影响,数据分布比较对称,此后的运算需要平均数时,应使用平均数。当数据中有极端数据,数据分布不对称时,应使用中数。当需要很快估计出集中趋势或需要知道最多的典型情况时,应使用众数。另外,我们在日常体育和艺术比赛中,也广泛地使用这些集中量数。例如“去掉一个最高分,去掉一个最低分“等等,都是为了能更好地反映集中趋势。 (三)差异量

前面讲到的集中量,只描述数据的集中趋势和典型情况,它不能说明一组数据的全貌。一组数据除典型情况之外,还有变异性的特点。对于数据变异性即离中趋势进行度量的一组统计量,称之为差异量(或变异量数)(mea-suresofvariation)。这些差异量主要有全距、平均差、四分差、百分位差等,它们被称为低效差异量;标准差或方差被称为高效差异量。 1.低效差异量

(1)全距(或两极差)(range):常用符号R表示。它是一组数据离散程度最简单的度量。计算起来也十分简便,可用如下公式求得:R=U-L《R:全距U:一组数据中的最大值L:一组数据中的最小值》 全距的计算比较简单,而且能回答我们直觉地提出的关于变量范围和间距等诸如此类的问题。但是全距与下面将介绍的其他差异量相比较,是比较不稳定的,因为,它仅仅是从分配中的两个个案的数值计算得来的,所以随机遇变化的幅度很大。

(2)四分差(quartiledeviation):是指在一个次数分配中,中间50%的次数的全距的一半。四分差常用符号Q表示。其计算公式为:? 《Q:四分差Q3:第三个四分位数Q1:第一个四分位数》 意义就是说,在全分配上第一个四分位数与第三个四分位数之间包含着全体项数之半。次数分配越集中,离中趋势越小,则这二者的距离也越小。因此,根据这两个四分位数的关系,观测次数分配的离散程度,也可以得到相当高的准确性。可见,四分差可说明某系列数据中间部分的离散程度,并可避免两极端值的影响。

(3)百分位数(percentile):百分位数的度量在心理学中也常用以表示度量的变异性。例如关于感受性的实验,要使刺激能被某组被试中百分之九十的人清晰的感受到,那就用到第九十个百分位数了。 百分位数的求法与中数相同。实际上中数本身也是一个百分位数,它是第五十个百分位数。

另外,百分位数也可以相当准确地用作图法求出,就是在绘成的累积次数曲线上进行简单的内插处理。 (4)平均差(简称均差)(averagedeviation):一般多用符号AD来表示。这也是一种检验离散程度通用的计算。尤其在阅读早年的心理学研究报告时,时常遇到用此度量表示离中趋势。它能告诉我们一组数据里所有的各量度与平均数的差数平均是多少。其计算公式为:?

{Ad:平均差M:平均数X:每一量数n:总量数之和等式里两条垂直线表示只计其绝对值}

平均差有其独特的功能,下一章将讲到的平均差误法(一种心理物理法)就是由平均差引伸而出的。但是平均差也有欠缺之处,即它易受极端数值的影响。 2. 高效差异量

高效差异量,顾名思义是指这些差异量能效率较高地反映分布范围。高效差异量有二个:标准差和方差。它们的具体优点很多:

与全距相比,标准差和方差大大减少了两极端值的影响; 与四分差相比,它们在计算过程中考虑到全部的离差;

与平均差相比,它们在离差测定中避免了绝对值,因而有利于代数处理, 从总体上看,与低效差异量相比,它们既能用于小样组,又能用于大样组。

(1)方差(或变异数、变差、均方)(variance):方差是每个数据与此组数据的平均数之差乘方后的均值,也就是离均差Xd平方后的平均数,它是度量数据分散程度的一个很重要的量数。方差作为统计量时,常用符号S2表示。方差的计算公式为:?

(2)标准差(standarddeviation)是方差的平方根,通常用S或SD来表示。标准差的计算公式为:? {S:标准差X:平均数Xi:个别分数n:总量数}

当观测次数n<25时,亦即样本较小时,若除数用n算出来的数值用来估计总体标准差时往往会偏低,因此可用n-1作为除数。上述公式就变为:?

实际运算时,为简化计算可将分子?演算成?这样公式写成:?

标准差是描写数据围绕其算术平均值离散程度的一个很重要的数据,具有重要的理论意义和实际意义: 1)首先说明平均数代表性的高低。

把平均数和离中趋势结合起来应用,对反映现象的典型特征来说,具有一定的意义; 2)其次,在确定现象水平的基础上,进一步测定现象发生的节奏性或稳定程度。 标准差用途很多,常用的主要有:

(1)表示变量频数分配的离散程度:

在均数相同的情况下,标准差大,表示变量值分布得较散;标准差小表示变量值在平均数附近分布密集。

(2)对变量频数分配作出概括性的估计:统计学发现大多数的测量资料在数量很大时,其变量频数分配是靠中间近的比较多,离开中间远的比较少,且越远的越少,这种分配称为常态分配。常态分配是有一定规律可循的。这就是:总体内约有68%左右的个体变量值在平均数±1个标准差范围内; 总体内约有95%左右的个体变量值在平均数±2个标准差范围内; 总体内约有99.7%左右的个体变量值在平均数±3个标准差范围内。

根据这个规律,只要算出平均数和标准差之后,就可以通过一批实际样本测量资料对所要研究的总体做出概括的估计。

(3)应用标准差计算平均数的标准误。同时它还是许多其他统计指标如正态曲线、相关系数、统计检验等的计算公式的要素。

标准差用途中的第三条,即用来计算均数的标准误(用符号表示),SX?计算标准误常常是显著性检验的最主要参数。标准误可用下列公式计算:从公式中可看到,标准误大小与研究现象本身变异量的大小成正比,与样本个除数的平方根成反比。 三、显著性检验 (一)显著性检验的含义

1表示样组上各种特性的常数叫做统计数(statistic),如平均数、中数、变差、差数、比值等等; 2表示全域特征的常数叫做参数(parameter),如全域的平均数、全域的中数、全域的差数、全域的比值等。

3依照成套的、有系统的方法,借助样组去对全域参数作出某些表达,叫作统计推理(或统计推论)(statisticalinference)。使用这类方法的目的在于检验统计假设,从而解决研究中的问题。所以统计假设(statisticalhypothesis)一般是指关于全域参数的假定。统计假设(H)可用下列算式符号表示:H∶θ=θ。

【θ:全域参数θo:假设上规定的某一数值】

4通常决定是否拒绝假设,取决于检验样组指标与假定的全域指标差异是否显著。故统计检验(statisticaltest)又称显著性检验(testofsig-nificance)。

1显著性检验的主要用途是检验两个或两个以上样本的统计量是否有显著差别。

1一般按三个步骤进行检验。第一步:提出假说或假定样组的平均数是从全域中取出来的。 第二步:通过实际计算,求出t、F或x2等值。

第三步:对假设做出取舍的决定。

1陈舒永(1983)曾对此作过精辟的分析,提出在使用显著性检验时应把握好以下四点:

(1)显著性水平的高低并不代表差异的大小,只表明这种差别因抽样误差引起的可能性小于某个水平。显著性水平仅指差别的可能性不大。

(2)显著不显著,并不代表实验设计的正确与否。经考验差异显著,只能说明这个差异由机遇造成的可能性很小,并不能保证实验设计就一定正确。

(3)显著或不显著只是相对的,不是绝对的。在心理学实验中,两种实验条件下得到的结果有差异时,常常要进行显著性检验。把差异显著和不显著的界线划在哪里完全是人为的。于使用显著考验的过程中,有人把这个分界线看得过重,好像P≤0.05和P>0.05有天壤之别。P≤0.05和P≤0.50固然差异很大,但P≤0.05和P≤0.06相比,其差异则是微不足道的,我们不能把数字过于绝对化。

(4)当检验结果相差不显著时,不能马上做出结论说没有差别,要考虑假不显著的可能,即两个样本来自不同的总体,但检验却得出差异不显著的结果即犯了第二类错误(typellerror)。这可能由于样本所包含的例数太

少或其他原因致使误差偏大等,必要时可加大样本重复实验。当然,当所得结果没有实际意义时,则不必进行显著性检验。

另外,显著性检验还有一些前提条件,这些在专门的统计学书籍中有详细的叙述。 (二)t检验

在心理学实验研究中,两项实验结果之差,有时是随机引起的差异,有时则是由自变量所造成的,t检验(或t检定)(ttest)就是分辨随机差异与自变量引起的差异的手段之—。 当总体(或母体)(population)指标X服从常态分布时,测统计量t为:?

【X:容量为的子样平均值nSx:子样均数的标准差,即标准误a:母体指标X的平均值】 t分布(或t分配)(tdistribution)的概率密度函数的图形是对称于直线t=0的曲线。

当n较小时,t分布较标准常态分布的分散程度大些,当n无限增大时,t分布则趋于标准常态分布。 样本(或子样)(sample)平均数和总体平均数的差数用标准误的倍数来表示,这就是t值。 若t(统计量)=0,则表示两个小样本来自同一母体。t进入危机领域,说明不来自同一个母体。 t检验用来确定两个平均数的差别是否显著。t检验因具体情况有所不同,检验方法也稍有差别。一般有以下三种情况:

1.比较样本平均数与总体平均数差异的显著性 2.比较同一批对象实验前、后差异的显著性


心理学实验笔记 2(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:Eviews软件操作

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: