现代心理与教育统计学复习资料

2020-02-21 00:22

第一章 心理与教育统计学基础知识 1、数据类型

称名数据 计数数据 离散型数据 顺序数据

等距数据 测量数据 连续型数据 比率数据

2、变量、随机变量、观测值

变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。

用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本

需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。

从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。

一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 统计指标 平均数 标准差 相关系数 回归系数 统计量 S r b 参数 μσρβ

5、统计误差

误差是测得值与真值之间的差值。 测得值=真值+误差

统计误差归纳起来可分为两类:测量误差与抽样误差。

由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。

由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差

第二章 统计图表

一、数据的整理

在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表

(一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f/N)或百分比f )来表示次数,就可以制成相对次数分布表 ( ?100%N

(三)累加次数分布表 (四)双列次数分布表

双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。

所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图

使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。

简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图

次数分布多边形图(frequency polygon)是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。

绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。

(三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表

条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。

圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。

散点图是用相同大小圆点的多少或梳密表示统计资料量大小以及变化趋势的图。

第三章 集中量数

集中量数用来表现数据资料的典型水平或集中趋势(central tendency)。 常用的集中量包括算术平均数、加权平均数、中位数和众数等等。 一、算术平均数

算术平均数(arithmetic average )一般简称为平均数(average)或均数、均值(mean)。 一般用M,或者用 X 表示。 算术平均数是最常用的集中量 (一)算术平均数的计算公式

1 X1?X2????Xn1nX??XX???Xi nnni?1

?(二)算术平均数的意义

算术平均数是应用最普遍的一种集中量。它是“真值”(true score)的最佳估计值。 真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值往往很难得到。

在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。 (三)算术平均数的优缺点

优点:反应灵敏、有公式严密确定、简明易懂、适合代数运算

缺点:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。 (四)计算和应用算术平均数的原则

同质性原则:算术平均数只能用于表示同类数据的集中趋势。

平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。

平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。 二、中位数

中位数(median)又称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用Md或Mdn表示 (一)中位数的计算方法 1、原始数据计算法

一组数据中无重复数值的情况 首先将一组数据按顺序排列

Xn?Xn

?1n?122若n为奇数,则Md为第个数 ;若 n为偶数,则Md?222、次数分布表计算法

?n?iMd?Lb???fb? ?2?fMd

公式中:Lb为中位数所在组的精确下限

fb为中位数所在组下限以下的累积频数 n为数据总和

fMd为中位数所在组的频数 i为组距

(二)中位数的特点及应用

中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数也比较容易。中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。一般用于下列情况:

1、一组数据中有极端数据时;

2、一组数据中有个别数据不确切、不清楚时; 3、资料属于等级性质时。 三.众数

众数(mode)用Mo表示,有两种定义:

理论众数是指与频数分布曲线最高点相对应的横坐标上的一点; 粗略众数是一组数据中出现次数最多的那个数。

众数也是一种集中量,也可用来表示一组数据的集中趋势。 众数的计算方法(观察法寻找粗略众数 ) 未分组数据中出现次数最多的数即为众数。

次数分布表中,频数最多那一组数据的组中值,即为众数。 四、算术平均数、中位数、众数三者的关系

在正态分布中: X?Md?MO在正偏态分布中: X?Md?MO在负偏态分布中: X?Md?MO五、其它集中量数 (一)加权平均数

加权平均数是不同比重数据(或平均数)的平均数,一般用 表示。其计算公式有两Xw种: ?Wi?Xi?ni?XXw?Xw? ?Wi?ni

(二)几何平均数

几何平均数(geometric mean)是n个数值连乘积的n次方根,用 M g或 X g表示。计算公式为: Mg?nX1?X2???Xn

当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势。 几何平均数的变式 XnXnX2X3n?1n?1M??????g X1X2Xn?1X1两边取对数,得

1

?lgXn?lgX1?lgMg? n?1注意:几何平均数计算的是平均的变化情况,如果要计算平均增长率,需要从几何平均数中减去基数1。

几何平均数的应用:

1.直接应用基本公式计算几何平均数

有少数极端数据,数据呈偏态分布;心理物理学中的等距与等比量表实验中.(例[3-8]P72)

2.应用几何平均数的变式计算

按一定比例变化的一列数据,一般用来求平均变化率如平均增长率. 例[3-9][3-10][3-11]P73 (三)调和平均数

N调和平均数(harmonic mean),用符号MH表示.也叫倒数平均数.公式为: MH?1?Xi调和平均数的应用

学习速度方面的问题.调和平均数在描述速度方面的集中趋势时,优于其他集中量 在有关研究学习速度的实验设计中,反应指标一般常取两种形式;

1、工作量固定,记录各被试完成相同工作所用的时间.例[3-13][3-14]P76 2、学习时间一定,记录一定时间内各被试完成的工作量,例[3-15]

第四章 差异量数

? 描述数据离散程度的统计量称为差异量。差异量越大,表明数据越分散、不集中;

差异量越小,表明数据越集中,变动范围越小。

? 一组数据的离散程度,常常通过数据的离中趋势特点进行分析。 一、全距、四分位距和百分位距 (一)全距 R (range)

全距是一组数据中的最大值(maximum)与该组数据中最小值(minimum)之差,又称极差。

R=Xmax-Xmin

(二)百分位差(百分位距)

百分位差是指两个百分位数(percentile)之差。 常用的百分位距有两种:

用几个百分位距能较好地反映一组数据的差异程度。

对于任何一组观察值,只要任意指定一个位置,就可以求出这个位置的数应该是多少;----百分位数

相反,如果给出一个数,也可以求出它应该在哪个位置.---百分等级 百分位数--频数分布中相对于某个特定百分点的原始分数,它表明在分布中低于该分数的个案占总频数的百分比。

百分等级分数--频数分布中低于特定原始分数的频数百分比。 (三)四分位距

Q?Q1四分位距是第一个四分位数与第三个四分位数之差的一半,计算公式为 Q?32(四)平均差

平均差(average deviation 或者 mean deviation)是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通常用AD或MD表示。

原始数据计算公式 ?X?XAD? n

(五)方差和标准差

方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差用 S2表示,总体的方差用 ?2表示。

标准差(standard deviation)是方差的算术平方根。一般样本的标准差用 S 表示,

? 表示。 总体的标准差用

标准差和方差是描述数据离散程度的最常用的差异量。 1、样本方差及标准差定义公式

22 ?X?X??X?X?2S?S? nn2、总体方差及标准差的定义公式 22???X??2???X?? ????NN

2?X?X

S? 是总体σ的无偏估计 n?1????


现代心理与教育统计学复习资料.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:高升专 酒店管理专业毕业论文 黄月

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: