第三章 统计整理
本章考核内容和考核要求: 考核内容:
1.统计整理的相关概念 (1)统计整理的定义 (2)统计整理的意义 (3)统计整理的步骤 2.统计分组
(1)统计分组的定义 (2)统计分组的作用 (3)统计分组的原则 (4)统计分组的方法 (5)统计分组体系 3.统计分布
(1)统计分布的概念 (2)统计分布的编制过程
(3)组距式变量数列编制的基本概念 (4)统计分布的表示方法 4.统计表
(1)统计表的概念
(2)统计表的构成和内容 (3)统计表的分类 (4)统计表的编制规则 考核要求:
1.统计整理的相关概念 1
识记:①统计整理的定义;②统计整理的意义;③统计整理的步骤。 2.统计分组
识记:①统计分组的定义;②统计分组的作用;③统计分组的原则;④统计分组的关键;⑤分组标志选择的原则;⑥划分各组界限;⑦统计分组体系。
3.统计分布
识记:①统计分布的定义;②统计分布的分类;③变量数列的分类;④组距与组数的定义;⑤等距数列与不等距数列的定义;⑥组限与组中值的定义;⑦频数与频率的定义;⑧统计分布的表示方法;⑨列表法;⑩折线图;⑾曲线图;⑿饼图。
领会:①组距与组数的关系;②直方图。
简单应用:①统计分布的编制过程;②组中值的计算;③频数与频率的计算。 4.统计表
识记:①统计表的定义;②统计表的作用;③统计表的构成;④统计表的内容;⑤统计表的编制规则。 领会:①统计表的分类。 第一节 统计整理的相关概念 本节主要内容: 一、统计整理的定义
统计整理是统计工作的一个重要环节,它是按照统计研究任务的要求,根据统计对象的特点,对统计调查所搜集到的大量原始资料进行分类、汇总或对已加工过的资料进行再加工,使其条理化、系统化、科学化,最后形成能够反映现象总体特征的统计资料的工作过程。
统计整理是统计工作的中心环节,是人们对社会现象从感性认识上升到理性认识的过渡阶段,也是人们从对个别现象的认识上升到对总体现象
的认识的重要阶段,在统计工作中起着承前启后的作用。
它既是统计调查的继续和深化,又是统计分析和预测的基础和前提,其质量不仅直接关系到调查资料能否发挥其应有的作用,而且也直接影响到统计分析和统计预测能否得出正确的结论。
三、统计整理的步骤
1.设计和编制统计整理方案(确定对调查中所搜集的哪些资料进行整理、如何进行分组、采用哪些汇总指标等)。
2.对原始资料进行审核与检查(保证资料的完整性、及时性、准确性)。 3.对原始资料进行统计分组和统计汇总(统计分组是做好统计整理工作的前提)。
4.编制统计表或绘制统计图,简明扼要地反映现象的数量。 注意统计整理各步骤间的关系:
设计统计整理方案和审核原始资料是统计整理的前提,统计分组是统计整理的基础,统计汇总是统计整理的中心,统计表或统计图则是统计整理的结果。
统计分组、统计汇总和编制统计图表是统计整理的基本方法。 【例题·单选题】统计整理主要是整理( )。 A.历史统计资料 B.统计分析资料 C.原始调查资料 D.综合统计资料 【正确答案】C
【答案解析】统计整理主要是整理原始调查资料。
第二节 统计分组 本节主要内容: 一、统计分组的定义
定义:统计分组是根据统计研究任务的需要,按照一个或几个分组标志将总体划分为几个组,使组与组之间具有差异性,而同一组内的单位保持相对的同质性。
含义: 第一,对总体而言,是“分”,同一性中存在特殊性;第二,对个体而言,是“合”,特殊性中表现出的同一性。
【例题·多选题】统计分组是将统计总体按一定标志区分为若干个部门的统计整理方法,它应有( )。 A.分组标志
B.是在统计总体内部进行的 C.是在统计总体之间进行 D.对总体而言是“分” E.对个体而言是“合” 【正确答案】ABDE
【答案解析】本题考查统计分组的定义。 二、统计分组的作用
1.凸显社会经济现象的规律
将零星、分散的资料系统化,凸显统计资料中隐藏的规律。
例如,对某企业工人的技能测试成绩分组,看各组的人数,占总体的比例,可以初步看出该企业工人技能水平的规律。 2.划分社会经济现象的类型
利用统计分组,能根据统计研究的目的,将现象区分为各种性质不同的类型来研究。
例如,企业按产业的划分、所有制形式的划分。
2
3.反映社会经济现象的内部结构
在统计分组的基础上,可以进一步计算总体内部各部分所占的比重,从而揭示总体的内部结构,反映总体与部分、部分与部分之间的区别与联系,还可以通过比较总体内部构成的动态变化,揭示现象发展变化的过程和规律。
例如,将某企业2009年至2011年成本构成情况列表看出,各类成本的变动情况
4.分析现象之间的相互依存关系
社会经济现象之间并不是孤立的,而是相互联系、相互依存、相互制约的。这种依存关系,只有通过统计分组才能揭示出来。
例如,100个商场的年销售额与商品流通费用情况列表可以看出两者之间的依存关系,年销售额越高,每百元商品销售额中的流通费用越少。
三、统计分组的原则
1.科学性原则选择反映特征的分组标志,凸显差异性。 2.完整性原则分组后,每个个体都有组可归。
3.互斥性原则每一个个体都只能归属某一组,不能同时归属两组或更多的组。
四、统计分组的方法
统计分组的关键:选择分组标志和划分各组的界限。 分组标志是指对总体进行分组时所遵循的标准或依据。
选择分组标志和划分各组界限不仅影响统计分组的科学性和资料整理的准确性,而且还影响到最终统计分析结果的质量。 (一)选择分组标志
在分组时,不同的分组标志,得出的结果不同。 选择分组标志时应遵循的原则: 3
1.根据研究目的与任务选择分组标志。
同一总体,研究目的不同,需要选用的分组标志就不同。
如,了解年龄构成,以年龄为分组标志;了解文化教育情况,以文化程度为分组标志。
2.选择最能够反映现象本质特征的标志作为分组标志。 同一研究目的下,往往有很多分组标志可供选择。
如,研究职工的生活水平,人均收入比职工的工资水平作为分组标志要好。
3.根据事物所处具体条件选择分组标志。
社会经济现象是随着时间、地点、条件的变化而变化的,事物所处的具体条件改变时,所选的分组标志也应随之改变。
例如,研究工业企业规模时,可供选择的分组标志很多,初级生产不发达,选择职工人数做分组标志;当生产力水平大幅提高,选择生产能力或固定资产价值作为分组标志更为合理。 (二)划分各组界限
分组标志可按品质标志与数量标志分组,划分各组界限时,要尽量保证组内同质性和组间差异性。
1.按品质标志分组,是指选择反映现象属性特征的品质标志作为分组标志,并在品质标志的变异范围内划分各组界限,将总体划分为若干类型。按品质标志分组,部分情况下比较容易,分组标志确定后,各组界限也随之确定。如,性别分男、女;部分情况下比较复杂,分组标志确定后,各组界限较难确定,如,将产品按用途分类。各有关部门制定统一标准和目录,按分类标准的规定进行分组。
2.按数量标志分组,是指选择反映现象数量特征的数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体分为若干性质不同的组成部分。
分组的关键在于确定使用什么样的数量作为数量界限。
【例题·单选题】下列分组中属于按品质标志分组的是( )。 A.人口按年龄分组 B.在校学生按性别分组 C.职工按工资水平分组
D.企业按职工人数规模分组 【正确答案】B
【答案解析】按品质标志分组,是指选择反映现象属性特征的品质标志作为分组标志,是不能用数值反映的。选B。
【例题·多选题】下列分组中属于按数量标志分组的是( )。 A.企业按所有制分组 B.企业按产值分组 C.企业按工人数分组 D.按计划完成程度分组 E.企业按隶属关系分组 【正确答案】BCD
【答案解析】按数量标志分组是指选择反映现象数量特征的数量标志作为分组标志。BCD属于按数量标志分组。 五、统计分组体系
对同一总体既可以按一个标志分组,也可以按两个或两个以上标志分组。按两个或两个以上的标志分组时,就形成了分组体系。 1.简单分组与平行分组体系
简单分组:将总体按一个标志分组,只能反映总体在某一方面的差异情况。
平行分组体系:对同一总体按两个或两个以上的标志分别进行简单分组而形成的分组体系。可反映总体多方面的特征。
平行分组体系中,所有分组都是独立进行的,各分组之间是平行并列的关系。
2.复合分组和复合分组体系
复合分组是对研究总体按两个或两个以上的分组标志层叠起来进行分组。复合分组构成复合分组体系。
进行复合分组时,先按主要标志对总体进行第一次分组,然后再按次要标志对总体进行第二次、第三次分组。但要注意分组标志不宜过多,否则会影响对总体的认识。
第三节 统计分布 本节主要内容: 一、统计分布的概念
概念:统计分布是指在分组的基础上,将总体的所有单位按组进行归并排列,形成总体中各个单位在各组间的分布。也称次数分布、分配数列。 统计分布的两要素:总体按某标志所分的组、各组的单位数(简称次数)。
分类:按分组标志的不同,分配数列可分为品质分配数列和变量分配数列。
变量数列又可分为:单项式数列和组距式数列
连续型变量数列和离散型变量数列 等距式分组和不等距式分组 开口组和闭口组
统计分布是统计整理结果的一种重要的表现形式,也是统计分析的一种重要方法。它可以表明个体的分布特征、结构状况,进而揭示研究标志的构成、平均水平及其变动规律。
4
【例题·单选题】分配数列包含两个组成要素,即( )。 A.分组标志和组距 B.分组和次数 C.分组标志和次数 D.分组和表式 【正确答案】B【答案解析】分配数列包含两个组成要素,即分组和次数。 二、统计分布的编制过程
统计分布的编制分为品质分配数列的编制和变量分配数列的编制。 编制单项式变量数列的步骤:
(1)将所有变量值按由小到大或由大到小的顺序排列。 (2)分别汇总出每一个变量值所对应的次数或频数。 编制组距式变量数列的步骤: (1)按某个标志分组。
(2)汇总出每组包含的频数。
(3)将每一组按从小到大的顺序加以排列。
(4)还可编制累积分布数列,向上累积和向下累积。
表3-15 某工厂工人生产零件数的组距式变量数列 按零件个数分组累积分布数列 (件) 工人数(人) 向上累积(高位制向下累积(低位制累积) 累积) 500以下 10 10 100 500~550 42 52 90 550~600 17 69 48 600~650 15 84 31 650~700 12 96 16 700以上 4 100 4 合计 100 5
三、组距式变量数列编制的基本概念 (一)组距与组数
组上限:每组的最大值 例如500~550一组,550为上限。 组下限:每组的最小值,500为下限。
组距:每组变量值中最大值-最小值 550-500=50。 组数:组距式变量数列编制过程中分组的个数。
特点:同一变量数列中,组数越多,组距越小;组数越小,组距越大。 确定组数和组距遵循的两个原则:一是要能区分总体内各个组成部分的性质差别;二是要能准确清晰地反映总体单位的分布特征。 (二)等距数列与异距数列
等距数列:各组组距都相等的数列。 异距数列:各组组距不同的数列。
标志值变动比较均匀的情况,按等距分组。
标志值变动很不均匀、出现急剧增长或下降、波动较大时,应采取不等距分组。
第六次人口普查从2010年11月1日零时开始,11月10日结束。主要数据2011年4月28日发布。采用的不等距分组:0~14、15~59、60以上。 (三)组限与组中值
组限:每个组两端的标志值。上限最大值(终点值);下限最小值(起点值)。
组中值:上限下限的中点。组中值=(组上限+组下限)/2 例如:500~550,组中值=(500+550)/2=525。 如果是开口组,组中值的求法: 首组组中值=首组上限-邻组组距/2