体育统计学参考公式
体育中常用的连加求和运算: n ?xi?x1?x2???xn nxiyi?x1y1?x2y2???xnyn? i?1 n2222?x1?x2???xn ?xii?1
2n ??2??x???xn???xi?1?x2 ?i?1?
为了避免符号过于复杂,今后凡在求和范围可以看清的条件下,通常将∑号上下标省略不写,简记为: xi
当?X??N当NN为奇数时为奇数时1N??1??中位数: ??????2????2Md?? ??1?????X?X当X?X当NN为偶数时为偶数时N NN??N?1?1?2?2?22???2
i?1?几何平均数:
Xi?X1?X???X2N2N?ii??11X?1NN 算术平均数:
NN
全距(极差,两极差):R=最大值(X max) -最小值(X min)
nn
xxii??xxn 1?1绝对差?xi?x平均差?ii? nni?1NN
(Xi?X)2 2?11?2?ii?总体方差的计算公式: N
NN (Xi?X)2总体标准差的计算公式: ??ii??11N
nn 2(xxii??xx))2 212?1Sn?ii??1n?1样本方差的计算公式: nn??11
n
(xi?x)2样本标准差的计算公式:
i?1Sn? ?1n?1??????n?1 1
正态分布函数的一些性质:
1. 概率密度函数在x 的上方,即f (x)>0
2. 正态曲线的最高点在均值?,它也是分布的中位数和众数
3. 正态分布是一簇分布,每一特定正态分布通过均值?和标准差?来区分。 ?决定
曲线的位置,称为位置参数;?决定曲线的形状,称为形状参数。
4. 曲线f(x)相对于均值?对称,尾端向两个方向无限延伸,且理论上永远不会与横轴
相交
5. 正态曲线下的总面积等于1,即概率值等于1 6. 随机变量的概率由曲线下的面积给出
任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布:
标准正态分布表的使用:
1. 先将一个一般正态分布转换为标准正态分布 2. 计算概率时,查标准正态概率分布表 3. 对于负的 x ,可由? (-x)??- ? ?x?得到 4. 对于标准正态分布,即X ~N(0,12),有
P (a? X ?b) ? ? ?b? ?? ?a? P (|X| ?a) ? 2? ?a? ?1 ?b????a???P(a?X?b)????????5. 对于一般正态分布,即X ~N(? , ?2),有:
?????? U?x???标准化的例子A(5,102)P(5 ?X?6.2)x??6.2?5U???0.12?10一般正态分布标准正态分布一般正态分布标准化的例子B(5,102)P(2.9 ?X?7.1)x1??2.9?5???.21 ?10x??7.1?5U?2??0.21?10U?标准正态分布???????? = 10? = 1.1664.0832.0832.0478???6.2x???0.12u2.957.1X-.210.21Z
正态分布理论在体育中的应用: 一:应用正态分布理论制定考核标准
制定考核标准的步骤: 1:制作正态曲线的分布草图。
2:计算出从﹣∞ 到 ui值所围成的面积概率。 3:查表求得各等级的ui值。
4:求得各等级标准的原始成绩xi值。举例说明(如书本例5.1)
二:应用正态分布理论制定离差评价表
制定离差评价表的步骤: 1:根据指标总数画好框表。
2:将各个指标的平均数填入0标准差等级线与各个指标纵线的交叉处。
2
3:计算1标准差,2标准差,3标准差的对应指标数值,并填入各级标准差等级线与各个指标纵线的交叉处。
特别要注意计量的方向性(如:田径中田赛与径赛的计分区别)。 4:依据指标成绩基础值和指标变化值画出不同时期的变化图线。 5:注意离差等级的划分标准合理制定。(参考标准有两种) 举例说明(如书本例5.2)
三:应用正态分布理论进行人数估算
应用正态分布理论进行人数估算的步骤: 1:作正态分布曲线的草图,以确定估计范围。 2:求各个区间的ui 值。
3:查表找到所估计范围的面积概率。
4:计算估计范围的人数。举例说明(如书本例5.3)
四:在综合评价中统一变量单位
? U分法:就是依据距离平均数有多少个标准差的距离来确定分数的方法。如果距离
平均数在正方向有2个标准差的距离,则记为U分为2分。在负方向有2个标准差距离,则记为U分为-2分。直接用u值来评分。
? Z分法:是通过U分转换成更加符合实际运用情况的分数计量方法。可以转换为百
分计分法,公式为:
ux?xz?50??100?50??100
66S
? 累计计分法:用于符合正态分布的前提下不等距升分的方法之一。其公式为: y?kD2?Z (y为累进分数,k为系数,D为等级变量,
注意这里的Z为某常数。k和Z需要计算确定)
? 百分位数法:用于不符合正态分布的条件下使用变换分数的变量标准化法。其公式
见教材P99(5.15)。
抽样分布拒绝域1 -?1 -?/2接受域H0值置信水平拒绝域?/2 临界值临界值样本统计量
3
假设检验的基本步骤:
(1)根据实际情况建立原假设H0 ,备择假设H1 (2)选择并计算检验统计量的取值
(3)确定显著性水平α,查表得出相应的临界值 (4)把实值与临界值进行比较,作出统计判断
假设检验的几个理论问题 一:假设检验的基础 (1)逻辑基础:反证法
(2)数理统计基础:小概率事件原理 二:显著性水平问题
(小概率事件发生的概率)
一般统计学用到的:α=0.05 或者α=0.01 三:临界值问题(见置信区间部分内容)
两种检验类型 一:双侧检验
——只是强调差异性,不强调方向性 二:单侧检验
——研究目的着重强调方向性的,有一定理论和经验基础作为背景
假设检验中的两类错误
? 1. 第一类错误(错否定,弃真错误)
– 原假设为真时拒绝原假设
– 第一类错误的概率为?,被称为显著性水平
? 2. 第二类错误(错接受,取伪错误)
– 原假设为假时接受原假设 – 第二类错误的概率为??
U检验
样本均数与总体均数的差异显著性检验μ=μ0分布情况总体方差情况样本条件公式使用情况总体方差σ2已知样本条件不σ=σ0 直接用u总体服从限检验原始公式计算正态分布总体方差σ2未知样本条件:用样本标准差S代n>45(30)替总体标准差σ,用公式变式计算。总体方差σ2已知样本条件:σ=σn>45(30)0 直接用u总体检验原始公式计算分布不明总体方差σ2未知样本条件:用样本标准差S代尽可能大替总体标准差σ,至少n>100用公式变式计算。 4
样本均数与总体均数的差异显著性检验μ=μ0μ=μ0u 检验原始公式:u?x???00μ=μn0u 检验原始公式的变式:(即:用样本标准差S代替总体标准差σ)u?x??0Sn两个样本均数的差异显著性检验μ1=μ2分布情况总体方差情况样本条件公式使用情况两个样本总体方差σ样本条件直接用μ均12与分属的总σ22已知不限1=μ2体均服从u检验原始公式正态分布总体方差σ12与样本条件:用变式,样本方σ22有未知的n1>45(30)差Sn12 和S22代替总2>45(30)体方差σ12和σ22总体方差σ12与样本条件:直接用μ分属总体σ22均已知>100 1=μn21分布不明nu检验原始公式2>100总体方差σ12与样本条件:用变式,样本方σ22有未知的n1>100 差Sn12 和S22代替总2>100体方差σ12和σ22两个样本均数的差异显著性检验μ1=μ2μ1=μ2x1?x2u 检验原始公式:u??21n??221n2μ1=μ2u 检验原始公式的变式:(即:用样本方差S12和S22分别代替总体方差σ12和σ22)u?x1?x2S221n?S21n2
5
率(比例)的差异显著性检验?样本率与总体率的差异显著性检验(π=π0)u?p??0?0(1??0)n?样本率与样本率的差异显著性检验(π1=π2)其中u?p1?p211p(1?p)(?)n1n2p?n1p1?n2p2n1?n2
t 检验 性质:常用于均数的假设检验
种类: 单样本t 检验;
独立样本t 检验; 配对样本t 检验 一:单样本 t 检验
? 检验比较的对象:样本均数与一个已知的总体均数
? 检验比较的目的:推断样本所代表的未知总体均数μ与已知的总体均数μ0是否相
等。(μ= μ0) ? 例子:“全民健身工程”国民体质检测测试中,已知我国健康成年男子脉搏均数为
72次/分,某调研人员在一个山区随机调查了n名健康成年男子的脉搏数(具体原始调研数据已知),能否据此认为该山区成年男子的脉搏数就是(或“就可以代表”)我国健康成年男子脉搏数。
二:独立样本t 检验
? 检验比较的对象:来自两个正态总体且相互独立的两个样本均数
? 检验比较的目的:推断两个样本所代表的总体均数μ1与μ2是否相等。(μ1= μ2) ? 例子:“全民健身工程”国民体质检测测试中,A调研人员在一个a山区随机调查了
n1名健康成年男子的脉搏数(具体原始调研数据已知),B调研人员在另一b山区随机调查了n2名健康成年男子的脉搏数(具体原始调研数据也已知),能否据此推断两山区健康成年男子的脉搏数没有差异。或者说能否推断两山区健康成年男子的脉搏数同属于一个共同的大总体的两个样本(即来源于同一总体)。
三:配对样本t 检验
? 检验比较的对象:两组数据均能配对的样本
? 检验比较的目的:比较经不同实验处理后或某因素变化后配对单位的差异是否显
著。( μd= 0)
? 例子:某调研人员在一个山区随机调查了n名健康成年男子的脉搏数(具体原始调
研数据已知),现在该调研人员对这n人进行了为期三个月的高原体能训练,三个月后再测得了这n名健康成年男子的脉搏数(具体数据已知),想了解这三个月的训练后,这n名健康成年男子的脉搏数是否有了显著性的变化。
6