第1章 绪论
1、统计学是以现象的数量特征为研究对象,利用自身特有方法,发现现象应有规律的一
门方法论科学。
2、总体和总体单位
(1)总体:指具有相同性质的一组个体组成的集合。即根据一定目的确定的所要研究事物的全体。
(2)总体单位:简称单位,是组成总体的各个个体。它是构成总体的基础。
3、样本和样本单位
样本:从总体中获得的一个群或组。从总体中抽取出来,作为代表这一总体的部分单位组成的集合体。
4、标志和标志表现
(1)标志:用来描述总体单位的属性、特征的概念和数值。 (2)标志表现:各单位的属性或特征的具体表现 (3)标志的分类:
按表现形式分:①品质标志
②数量标志
按有无差异分:①不变标志
②可变标志
(可变的数量标志称为变量)
5、指标:是用于说明统计总体或样本数量特征的名称和数值的总和。 6、统计调查方法
(1)普查 (2)重点调查 (3)典型调查 (4)抽样调查 7、统计分组 (1)统计分组的原则:①穷尽原则②互斥原则 (2)统计分组分类 品质标志分组:属性分布数列
统计分组 单项数列
数量标志分组:变量分布数列 等距数列 组距数列 异距数列
(3)统计分组形成次数分布数列,次数分布数列有两个组成要素:①组别②频数(③频率④累计频数(向上累计、向下累计))
(4)几个基本概念 ①组距②上限③下限④组中值⑤次数密度(指本组的次数与本组组距之比,异距数列中用到)
第2章 描述统计
1、集中趋势
(1)集中趋势是指一组数据向分布的中心集中的现象。描述集中趋势的实质是找出数据的集中点或中心值。
(2)数据分布集中趋势的测度指标称为平均指标。
算术平均数x 调和平均数H 数值平均数(特点:受极端值影响) 常见的平均指标 几何平均数G 中位数Me 位置平均数(特点:不受极端值影响) 众数Mo (3)计算公式
(x、H、G都有简单和加权两种算法,分别适用于未分组和已分组的数据) xfx??①算术平均数x:x?、x?n?f 二者的实质一样的,已知条件不同, 导致的算法不同而已 其中二者的关系:m?xf ②调和平均数H:H?n1?x、x??m m?xfx?
(调和平均数因变量值在分母上,因此又称倒数平均数,要求变量值不能为0) ③几何平均数G:G?n?fxG?、?(几何平均数因算法为变量值的连乘积,故如果有一变量值为0,则计算结果为0)
(常见的应用几何平均数的例子:连续作业的流水线、存贷款的复利算法、产值等
的连续增长) ④中位数Me:总体各变量值按大小顺序排列,处于中点位置的变量值就是中位数。
f?1?单项式数列:中位数位置? 2组距数列:中位数位置??f2 ?f中位数计算公式Me?L?⑤众数Mo:总体中出现次数最多的数。
2?Sm?1fm?i(下限公式)
单项式数列:直接确定众数
组距数列:先确定众数位置,然后计算众数Mo?L?(4)中位数、众数和算术平均数的关系:Mo?3Me?2x
?1 ?i(下限公式)
?1??22、离散程度 (1)除数据的集中趋势之外,数据的离散趋势 是数据分布的一个重要特征,它所反映的是各个变量值远离中心的程度,也称为离中趋势。 (2)描述数据离散程度的指标主要有: 全距R 平均差A?D 二者的基本思想一致,只是计算时对负号的数学处理方法有异,?应用更广泛 标准差? 方差? 变异系数V (3)计算公式 ①全距R=最大值-最小值 2x?xfx?x??②平均差A?D:A?D?、A?D?n?f③标准差?:?? ?(x?x)n2、??2(x?x)f??2f、??x2?x2、??p(1?p)(是非标志的标准差) ④方差?:?22?(x?x)?n2、?2?(x?x)??f2f、??x?x 222⑤方差的加法定理:总方差?2?(x?x)?n、组间方差?2?(x?x)?i2nin、平均组内方差?2i???2iinn。三者关系?2??2??i2 ⑥变异系数V:V???x?100% (反应平均值代表性大小用变异系数;变异系数消除了原单位的影响。) 3、相对位置测度及异常值检测 (1)z分数:通常被称为标准化值,表示观察值偏离平均数的标准差个数。z?2x?x?
(2)切贝谢夫定理:在任意一组数据中,至少有(1?1/z)个数据落在与平均数z倍标准差范围内,z是大于1的任意数。
第3章 时间序列分析 1、时间序列是社会经济指标的数值按时间顺序排列而形成的一种数列。 2、时间序列的种类 时期序列 绝对数时间序列 时点序列 时间序列 相对数时间序列 平均数时间序列 3、时间序列的指标分析法 环比发展速度 发展速度 定基发展速度 环比增长速度 (2)速度指标 增长速度 定基增长速度 增长1%的绝对值?上期水平 100 几何平均法:参考第2章几何平均数G 平均发展速度 高次方程法:用于存量指标平均发展速度的计算 (年距发展速度:本期发展水平与去年同期发展水平之比) 平均增长速度
a?时期序列:a? n未分组:a?绝对数 连续 ?a naf?已分组:a??f平均发展水平 时点序列 aa1?a2?a3?...?n2 间隔相等:a?2n?1(1)水平指标 不连续 a?a3a?ana1?a2f1?2f2?...?n?1fn?122间隔不等:a?2 f1?f2?...?fn?1 相对数:c?a(三种情况) b逐期增长量 增长量 累积增长量等于各期逐期增长量之和
累积增长量 年距增长量:报告期某月发展水平与上年同月发展水平之差。
4、长期趋势分析
(1)时间序列的因素可以归纳为长期趋势、季节变动、循环变动和不规则变动四种。