第一章、总论 一、什么是统计学 ? 统计的含义与本质:用数字说明现象的本质 1.统计活动 2.统计数据 3.统计学
统计的含义及关系 政府统计 单位统计 经营性统计 其他
统计数据(基础) 统计学 统计活动 (理论概括) (工作过程) 原始数据:未加工价值更大 次级数据
? 统计学的产生和发展
1.古典统计学时期(萌芽——17世纪末到18世纪末) 描述为主
国势学派:德国的康令和阿亨瓦尔 偏重事物性质的解释而不注重数量分析 有名无实 政治算数学派:英国的威廉配第和约翰格朗特 主张以数字、重量和尺度来研究社会经济现象及其相互关系 有实无名
2.近代统计学时期(18世纪末到19世纪末) 统计推断方法体系基本确立
数理统计学派:比利时的凯特莱 主张用研究自然科学的方法来研究社会现象,正式把概率论引入统计学,并最先用大数定律论证了社会生活中随机现象的规律性,还提出了“误差理论”和“平均人”思想 奠定统计学理论基础
社会统计学派:德国的克尼斯 认为统计学是一门社会学科,是研究社会现象变动原因和规律性的实质性科学,其显著特点是强调对总体进行大量观察和分析,通过研究其内在联系来揭示社会现象的规律 德国恩格尔提出的恩格尔系数 美国经济学家库兹涅茨和英国经济学家斯通等人研究的国民收入和国内生产总值的核算方法
3.现代统计学时期(19世纪末到现在) 统计方法与应用全面发展 显著特点:数理统计学由于同自然科学、工程技术科学紧密结合及被广泛应用于各个领域而获得迅速发展,各种新的统计理论与方法、尤其是推断统计理论与方法得以大量涌现。
? 统计学的学科性质
1.研究对象: 数量性(用数字说明现象本质,包括数量特征、数量关系、数量规律)、总
体性(统计只研究总体不研究个体)、差异性(构成总体的个体必须存在差异) 2.学科范畴: 方法性、层次性、通用性 3.研究方式: 描述性、推断性
? 统计学的作用
——统计学的职能:信息职能(提供各种信息资料)、咨询职能(提供信息整理)、监督职能(监督经济运行状况)、服务职能(服务社会)
1.统计学为我们认识自然和社会提供了必须的方法和途径 2.统计学在指导生产活动过程中发挥着重要作用 3.统计学在社会经济管理活动中的作用更为显著 4.统计学为科学研究提供了有力的手段
二:统计数据类型与研究方法 ? 统计数据类型
1.计量尺度不同:定性数据和定量数据
——定型数据:只能用文字或数字代码来表现事物的品质特征或属性特征的数据
—定类数据:对事物属性进行平行分类或分组 特点:只测度量事物类别差异,各类别地位相等。 注意:分类必须符合穷尽和互斥要求
—定序数据:对事物按照一定的排序进行分类的结果,表现为有顺序的类别,由定序尺度计量而成。
——定量数据:用数值来表现事物数量特征的数据
—定距数据:对事物类别或次序间距离的测度,能区分类型、排序、并计算数量差距
—定比数据:不仅能体现事物之间数量差距,还能通过对比运算,即计算两个测度值之间的比值来体现相对程度的数据,由定比尺度计量而成 类别 功能 区分性质 排列顺序 绝对差量 相对比值 定类数据 √ 定序数据 √ √ 定距数据 √ √ √ 定类<定序<定距<定比 定比数据 √ √ √ √ 功 能 递 增 统计分析的所有方法都只适用于定量数据
2.表现形式不同:绝对数、相对数、平均数
——绝对数:用以反映现象或事物绝对数量特征的数据,以最直观、最基本的形式体现现象或事物的外在数量特征,有明确的计量单位。绝对数是表现直接数量标志或总量指标的形式。 ——相对数:用以反映现象或事物相对数量特征的数据,通过另外两个相关统计数据的对比来体现现象(事物)内部或现象(事物)之间的联系关系。相对数是表现相对指标的形式。 ——平均数:用以反映现象或事物平均数量特征的数据。体现现象某一方面的一般数量水平。平均数是表现平均指标的形式。
3.来源不同:观测数据、实验数据 ——观测数据:通过统计调查或观测的方式而获取的反映研究现象客观存在的数量特征的数据。这类数据是在没有人为控制的条件下获得的。有关社会经济现象的统计数据几乎都是观测数据
——实验数据:是在人为控制的条件下,通过实验的方式获得的关于实验对象的数据。自然科学研究中的数据大都属于实验数据。
4.加工程度不同: 原始数据、次级数据。 5.时间或空间状态不同:时序数据、截面数据
? 统计数据研究过程
统计设计——数据收集——数据整理——数据分析与解释
? 统计数据研究方法 1.大量观察法 2.统计分组法 3.综合指标法 4.统计推断法 5.统计模型法
三、统计学的基本概念 ? 总体
1.总体的含义:由许多个体组成、具有某种共同性质、随着研究目的变化
总体的特征:大量性、同质性、差异性(大量性是条件,同质性是基础,差异性是前提) 2.总体的分类
—个体数量是否有限: 有限总体、无限总体
有限总体:由有限多个个体所组成的总体,即总体容量是有限的 无限总体是指由无穷多个个体组成的总体,即总体容量是无限的 存在形态不同: 具体总体、抽象总体
具体总体:由现实存在的各个具体事物所组成总体
抽象总体:也成设想总体,由想象中存在的各个假定事物所组成的总体 个体能否计数: 可计数总体、不可计数总体
可计数总体:指能对其所包括的个体进行计数且计数结果能加总的总体。 特征:所包含的个体具有相同的计量单位,可以计算总体单位总数 不可计数总体:对其所包括的个体不可计数或计数结果不能加总的总体 特征:所包含的个体通常不具有相同的计量单位,不能计算总体单位总数 个体是否人为划定: 自然总体、人为总体
自然总体:自然确定的个体所组成的,即个体是明确的、易定的。 人为总体:由人为确定的个体所组成的,其个体往往不明显或难以确定
? 样本
1.样本的含义:指从总体中抽取的一部分个体所组成的集合,也成子样。样本中所包含的的
个体数称为样本容量或样本单位数。
实践上:样本的容量总是处于总体容量与1之间。样本不具有唯一性,除非样本就是总体本身
2.样本与总体关系
首先:总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影 其次:样本是用来推断总体的。
第三:总体和样本的角色是可以改变的
? 标志
1.标志的含义:描述个体特征的名称。——必须通过标志表现(标志名称+标志值)才能描述个体特征。对于任何一个标志,总体或样本中的个体数有多少,其标志表现就有多少。
2.标志的分类
结果的表示方式不同: 品质标志(文字)、数量标志(数字)
品质标志:表明个体的属性特征,其结果一般只能用文字表述而不能用数值表示,即只能表现为定性数据
数量标志:表明个体的数量特征,其结果以数值表示,即表现为定量数据。 ————品质标志表现需要采用定类尺度或定序尺度来计量,数量标志表现需要采用定距尺度或定比尺度来计量
在每个个体上的表现结果是否相同: 不变标志、可变标志
不变标志:每个个体上的标志表现均相同,不变标志是相关个体集合成总体的基础,总体的同质性也正体现在要求至少具有一个不变标志
可变标志:每个个体上的标志表现不完全相同,这种个体标志表现不相同的现象,在统计学上称为变异。总体的差异性也正体现在至少有一个可变标志。 表现个体特征的直接程度: 直接标志、间接标志
直接标志:也称第一性标志,直接表明个体的属性特征或者数量特征。一般的,品质标志都是直接标志
间接标志:也称第二性标志,通过两个或两个以上数量标志计算后(通常是对比)间接表明个体数量特征的标志。间接标志是以直接标志为基础的。一般的,间接标志都是数量标志。
? 变量
1.变量的含义:狭义上:可变的数量标志;广义上:可变标志就是变量 2.变量的分类:
反映数据的计量尺度不同: 定性变量、定量变量 定性变量包括:定类变量、定序变量 定量变量包括:定距变量、定比变量
所受影响因素不同: 确定性变量、随机性变量 数值的变化是否连续: 离散型变量、连续型变量
离散型变量:只能取整数值的变量,即变量的变化是不连续的、间断的。离散型变量只能采用计数的方法来取得其数值。
连续型变量是指可以在一定区间内取任意实数值的变量,即变量的变化是连续的、不间断的。连续型变量要采用测量或计量的方法来取得其数值。定类和定序尺度只能用于计量离散型变量,而定距和定比尺度既可以用来计量离散型变量又可以计量连续型变量。
年龄既是连续又是离散变量
? 统计指标
1.统计指标的含义,简称指标,是反映现象总体数量特征的概念及其数值。 2.统计指标由指标名称和指标数值两个基本部分组成。 3.统计指标的三个特点:数量性、综合性、具体性。
? 统计指标与标志的关系:既有区别,又有联系
1.区别:指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征; 指标和标志的表现形式不同,指标是用数值来表现,而标志则既有只能用文字来表现的品质标志,又有用数值来表现的数量标志。
2.联系:标志是计算统计指标的依据,即统计指标数值是根据个体的标志表现综合而来的。
? 统计指标的分类
计算的范围不同: 总体指标、样本指标
总量指标——绝对数 表现形式不同 相对指标——相对数 平均指标——平均数 分析内容不同: 质量指标 数量指标 时间不同: 动态指标 静态指标
描述指标
功能不同 评价指标 预警指标
? 统计指标的设计
1.科学确定指标的名称和含义
2.科学确定指标的计算范围和计算方法 3.确定指标的数据来源和量化尺度 4.确定合适的计量单位
? 统计指标体系
1.统计指标体系的含义:反映同一总体或样本多个方面数量特征的一系列相互联系的统计指标所形成的的整体
2.统计指标体系的表现形式:数学等式关系、相互补充关系、相关关系、原因条件和结果关系
3.统计指标体系的设计:目的性原则、科学性原则、可行性原则、灵活性原则、层次性原则、联系性原则、协调性原则
第二章、统计数据的收集、整理与显示