第一章 总论
统计是从数据中获取信息的科学,一门研究客观事物数量方面的方法论科学。其研究对象现象总体的数量特征和数量关系。
总体或总体单位的区分不是固定的,在一定条件下可以相互转化。 统计的多重含义:统计工作,统计资料,统计学
统计总体:凡是客观存在的,在同一性质基础上结合起来的许多个别事物的整体,就是统计总体。
统计总体的基本特征:同质性,大量性,差异性。 总体单位:构成统计总体的每个基本单位或元素称为总体单位 标志:单位的属性、特征 标志的分类:
品质标志:用文字表示属性 数量标志:用数字表示特征
不变标志:各单位具体表现相同 可变标志:各单位具体表现不同 标志值
指标:说明总体数量特征的概念
数量指标——总量指标——时期指标,时点指标 质量指标——相对指标,平均指标 统计指标的特点:数量性、综合性、具体性。 变量:可变的数量标志和统计指标。
变量值:即变量的具体数值,包括标志值和指标数值
统计学的基本方法有大量观察法、统计分组法、统计指标法、归纳推断法和实验设计。
第二章 统计调查
原始资料:是指向调查单位搜集的,需要由个体过渡到总体的统计资料。另外,在统计调查中,也必然会用到对次级资料的收集。 次级资料:是指经过加工,由个体过渡到总体,能够在一定程度上说明总体现象的统计资料。 统计调查的种类:
(一)按组织方式不同,分为统计报表和专门调查
(二)按所包括的调查单位是否完全,分为全面调查和非全面调查 (三)按登记时间是否连续,分为经常性调查和一次性调查
调查时间:指调查资料所属的时间。调查的是哪个时点哪个时间段上的数据。
调查期限是指整个调查工作的起止时限。包括搜集资料或报送资料的整个工作所需的时间。经常性调查:是连续性的调查
一次性调查:是间隔一定时间,一般是相当长时间,如一年以上,它是对事物在一定时点上的状态进行登记。
统计报表:为了定期取得系统、全面的基本统计资料而采用的一种搜集资料的方式。
专门调查:是为了研究某些问题,由进行调查的单位专门组织的调查。这种调查,多属一次性调查,如普查、重点调查、抽样调查、典型调查等。 普查是专门组织的一次性的全面调查
重点调查是在调查对象中选择一部分重点单位所进行的调查。
抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位进行观察,用以推算数量特征的一种调查方式。 典型调查是根据调查的目的任务,对所研究现象总体进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。 统计调查误差有两类:一是登记误差,一是代表性误差。
第三章 统计整理 统计分组:是指根据事物内在的特点和统计研究的需要,将统计总体按照一定标志区分为若
干组成部分的一种统计方法。反映组间本质的不同,突出组与组之间的差异,抽象与模糊组内各单位的差异。
统计分组的作用:
(一)可以区分现象的类型
(二)可以分析总体内部结构和总体结构特征 (三)可以揭示现象之间的相互依存关系 统计分组的方法:
按品质标志分组:按品质标志分组法分组就是选择反映事物属性差异的品质标志为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成为若干个性不同的组成部分 按数量标志分组:按数量标志分组就是按反映事物数量差异的数量标志为分组标 志,并在数量标志的变异范围内,将总体划分为性质不同的若干组成部分。 在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做次数分布。
变量数列:是依据数量标志分组所编制的分布数列。 单项式数列:离散变量,变量值变动范围较小。
组距数列: 注意组距;开口组的组中值;上限不包括在内 组距数列的分类:
组距数列按各组组距是否相等,分为等距数列和异距数列
组距数列按变量是否连续,分为连续型组距数列和离散型组距数列
组中值是各组变量值的中间数值,通常根据各组上限、下限进行简单平均求得,公式为: 组中值= 本组上限?本组下限 2“上组限不在内”。
邻组组距缺下限的开口组组中值= 上限?2
邻组组距下限?缺上限的开口组组中值=
2
第四章 总量指标和相对指标
总量指标:反映社会经济现象的总规模、总水平或工作总量。是统计指标中最基本的指标 总体单位总量:即总体单位总数,表示总体本身的规模大小
总体标志总量:即总体各单位某一数量标志值总和表示所研究现象的总水平 例:研究某市工业生产情况 该市所有工业企业是总体
所有工业企业数是总体单位总量
总体标志总量:职工人数,产值,利润总数……
总体单位总量和总体标志总量的区分,不是固定不变的,而 是随着研究目的和研究对象的不同而变化的。 例:某地区工业企业职工总数
以该地区工业企业职工为统计总体时——总体单位总量 以该地区每个工业企业为总体时——标志总量
时期指标:反应社会经济现象在一段时期内发展变化的总量,指标数值可以累计相加,数值大小和时间长短有直接关系。
时点指标:反映现象在某一时刻(瞬间)状态上的水平,不同时间上的指标值不能相加,加起来没有意义,数值大小与时间间隔没有直接关系。
? 判断哪些是时期指标,哪些是时点指标?
一、结构相对数可以说明现象变化过程和规律
结构相对数 =
【0,1】; 各部分比重和为1。如:甲地职工男职工人数占职工人数的70% 二、比例相对数表明总体范围内各个局部之间的比例关系和协调平衡状况。
比例相对数=
如:甲地职工男职工人数是女职工人数的2倍 三、比较相对数反映现象发展水平的差别程度。
比较相对数 =
如:甲地职工平均收入是乙地职工平均收入的1.3倍 四、动态相对数
动态相对数 =
同一事物在不同时间上的数量对比
如: 某农场由原来噶100只鸡经过2年繁殖后变成了200只 五、强度相对数
强度相对数 =
两个性质不同但有一定联系的总量指标之比
如:人口密度=人口总量指标/面积总量 指标人均产值=国民生产总值/人口数量
六、计划完成程度相对数
计划完成程度相对数 =
总体总体某报告总体
计划任务数为相对数时: 计划完成程度实际为上年的百分数??100﹪ 计划为上年的百分数相对数
提高1?实际百分数
降低??100﹪
提高 1?计划百分数降低
例:己知某厂2000年的计划规定产品产量要比上年实际提高5﹪而实际提高了7﹪。则
计划完成1?7﹪ ??100﹪?101.9﹪1?5﹪程度
▲相关关系的类型(线性相关、非线性相关、完全相关、不相关)
r=1 完全正相关 0< r <1 正相关 r=0 不相关 -1< r <0 负相关 r =-1 完全负相关 不同时期比较 不同现象比较 同一时期比较 同类现象比较 不同总体比同一总体比较 较 强度相对数 部分与部分部分与总体实际与计划 比较相对数 比 比 比 动态相对数 比例相对数 结构相对数 计划完成相对数 (六)强度相对指标
某一总量指标数值的总量指标数值相对数另一有联系但性质不同?强度 例如,2000年第五次人口普查,我国有人口126583万人,国土面积为960万平方公里,则
人口密度=126583/960=132(人/平方公里)
例如:设某城市有人口200万人,有医院床位40000张,则:
医院床位数(张) 每千人拥有的医院床位数?人口数(千人)
40000(张) ??20(张/千人)2000(千人)
人口数(千人)2000(千人)每张医院床位负担的人口数???0.05(人/个) 医院床位数(个)40000(个)第五章 平均指标
说明数据的集中趋势,
特征:1、总体同质性 2、数量抽象性 3、一般代表性 种类:数值平均数: 算术平均数,调和平均数,几何平均数 位置平均数: 中位数,众数
一、算数平均数的基本形式 例: 工资总额平均工资? 算术职工人数总体标志总量? 总成本平均数总体单位总数平均成本? 总产量
算术平均数与强度相对数的区别:强度相对数反映的是事物的强度、密度、普遍程度。 算术平均数反映的是事物的一般水平。
(注)1、劳动生产率是平均数,而不是相对数 劳动生产率=产值/职工人数
社会劳动生产率=社会总产值(GDP)/社会劳动者人数 平均每个劳动者创造的生产值
2、人均GDP不是平均数,是强度相对数 人均GDP=社会总产值(GDP)/全部人口 算术平均数:用于总量等于各分量加和的情形 N简单算术平均; XiX1?X2????XN?
X??i?1NN
例:某售货小组5个人,某天的销售额分别为520元、600元、480元、750元、440元,求平均每人日销售额。
解:平均每人日销售额为: X520?600?480?750?440X?? N5 2790??558?元? 5 加权算术平均。变量值,权数,组距数列 mXf X1f1?X2f2????Xmfmi?1ii?m X?f1?f2????fmfi i?1 ???X 为算术平均数; 为第 组的次数;m 为组数; 式中:
Xiii 为第 组的标志值或组中值。
【例】某企业某日工人的日产量资料如下:
日产量(件) 10 11 12 13 14 合计 工人人数(人) 70 100 380 150 100 800
计算该企业该日全部工人的平均日产量。