偏态系数的绝对值越大 二、标准分数(也称为“Z”分数) 项目 主要内容 适用 在统计上,均值和标准差不同时,来自不同分布的变量值不可比,但是每个数值在变量分布中相对于均值的相对位置是可比的,因此可以通过计算标准分数来比较不同变量的取值。 标准分数给出了数值距离均值的相对位置。 计算 (原始分数Xi-平均分数X)÷标准差s 实际当数据服从对称的钟形分布时,可以运用经验法则来判应用 断与均值的距离在特定倍数标准差之内的数据项所占比例。 约有68%的数据与平均数的距离在1个标准差之内,标准分数在【-1,1】范围内; 约有95%的数据与平均数的距离在2个标准差之内;标准分数在【-2,2】范围内; 约有99%的数据与平均数的距离在3个标准差之内;标准分数在【-3,3】范围内。 考点四:变量间的相关分析 一、相关关系的类别 分类标准 类别 内含 相关的程完全相关 一个变量的取值变化完全由另一个变度 量的取值变化所确定。称这两个变量完全相关。 不完全相大部分相关现象均属于不完全相关。 关 不相关 两个变量的取值变化彼此互不影响。 相关的方正相关 一个变量的取值由小变大,另一个变向 量的取值也相应的由小变大。(两个变量同方向变化)。 负相关 一个变量的取值由小变大,另一个变量的取值由大变小(两个变量反方向变化)。 相关的形线性相关 pearson相关系数只适用线性相关关式 系。 非线性相两个相关变量之间的关系近似于某种关 曲线方程的关系。 【注】两变量之间的关系可以用散点图来展示。 二、相关系数的取值 相关系数是度量两个变量之间相关关系的统计量。最常用的相关系数是pearson(皮尔逊)相关系数。相关系数的取值范围在【-1,1】之间。 r的取值 两变量之间的关系 0 考点一:抽样调查的基本概念 【例】在研究某城市居民的家庭消费支出时,在全部50万户家庭中随机抽取3000户进行入户调查,这项抽样调查中的样本单位是指该城市中( )。 A.抽取出来的3000户家庭 B.50万户家庭 C.每一户家庭 D.抽取出来的每一户家庭【答案】D 概念 含义 本题中 总体 调查对象的全体 50万户家庭 总体单元 组成总体的各个个体 每一户家庭 样本 总体的一部分,由从总体中按一抽取出来的定原则或程序抽出的部分个体3000户家庭 所组成。样本也是一个集合。 样本单位 每个被抽中进入样本的单位称抽取出来的每为入样单位。 一户家庭 样本量 样本中包含的入样单位的个数3000户 称为样本量。 抽样框 供抽样所用的所有抽样单元的全部50万户家名单,是抽样总体的具体表现。庭消费信息的常见的抽样框有名录框,如企业载体 名录、电话簿、人员名册。 总体参数 即总体指标值,它是未知的常50万户家庭的数,是根据总体中所有单位的数平均消费支出 值计算的,是通过调查想要了解的,不受样本的抽选结果影响。常用的总体参数有总体总量、总体均值、总体比例、总体方差。 样本统计是根据样本中各单位的数值计抽取出来的量(估计算的,是对总体参数的估计,也3000户家庭的量) 称估计量。它是一个随机变量,平均消费支出 取决于样本设计和正好被选入样本的单元特定组合。常用的样本统计量有样本均值、样本比例、样本方差。 考点二:概率抽样与非概率抽样 抽样特点 具体方式 方法 概率1.按一定概率以随机原则抽取样本。 1.简单随机抽抽样 2.总体中每个单元被抽中的概率是样 已知的或者是可以计算出来。 2.分层抽样 3.当采用样本对总体参数进行估计3.系统抽样 时,要考虑到每个样本单元被抽中的4.整群抽样 概率。若每个单位被抽中的概率相5.多阶段抽样 等,则称为等概率抽样;否则称为非等概率抽样。 非概抽取样本时并不是依据随机原则。调1.判断抽样 率抽查者根据自己的方便或主观判断抽2.方便抽样 样 取样本。 3.自愿样本 4.配额抽样 考点三:抽样调查的一般步骤 1.确定调查问题2.调查方案设计3.实施调查过程4.数据处理分析5.撰写调查报告 考点四:抽样调查中的误差 误差 形成原因 抽样由抽样的随机性造成的,用样本统计量估计总体参数时误差 出现的误差。 非抽样误差 除抽样误差外,由其他原因引起的样本统计量与总体真值之间的差异。 (1)抽样框误差:样本框不完善造成的 (2)无回答误差:调查人员没能够从被调查者那里得到所需要的数据。无回答分为: ①由于随机因素造成的。如被调查者恰巧不在家。 ②由于非随机因素造成的:如被调查者不愿告诉实情而拒绝回答。 (3)计量误差:由于调查所获得的数据与其真值之间不一致造成的误差。这种误差可能是由调查人员、问卷设计、受访者等原因造成的。 考点五:几种基本概率抽样方法的判定 方法 关注的知识点 简单随1.最基本的随机抽样方法,每个单位的入样概率相同。 机抽样 【例】某校高三年级学生共l000人参加考试,将1000份试卷编好号码后,从中随机抽取30份计算平均成绩,此种抽样方法为(A)。 A.简单随机抽样 B.系统抽样 C.分层抽样 D.整群抽样 2.不放回简单随机抽样每个单位最多只能被抽中一次,比放回抽样有更低的抽样误差。 3.适用条件:(1)抽样框中没有更多可以利用的辅助信息(2)调查对象分布的范围不广阔(3)个体之间的差异不是很大。 分层抽1.理解概念:先按照某种规则把总体分为不同的层,样 然后在不同的层内独立、随机的抽取样本。 【例】在调查某部门平均工资时,先将该部门员工分为经理和普通职员两类,再采用随机原则分别在经理和普通职员中抽取样本,这种抽样方法属于(C)。 A.简单随机抽样 B.整群抽样 C.分层抽样 D.等距抽样 2.适用条件:抽样框中有足够的辅助信息,能够将总体单位按某种标准划分到各层之中,实现在同一层内,各单位之间的差异尽可能小,不同层之间各单位的差异尽可能大。 系统抽1.理解概念:将总体中的所有单元按一定顺序排列,样 在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。 【例】调查一个居委会4000户家庭人均收入,编号1-4000,要抽取40户,在1-100号中随机确定15号,抽取的样本为15;15+100;15+200;15+300;??15+3900,这种抽样方法属于(系统抽样)。 2.优点:对抽样框的要求比较简单,它只要求总体单位按一定顺序排列,系统抽样的估计效果与总体排列顺序有关。 整群抽1.理解概念:将总体中所有的基本单位按照一定规则样 划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部的基本单位,对没有抽中的群则不进行调查。 【例题:单选题】在调查某城市小学教师亚健康状况时,从该城市的200所小学中随机抽取40所,每个被抽取小学中的所有教师都参与调查,这样抽样方法属于(B)。 A.简单随机抽样 B.整群抽样 C.分层抽样 D.等距抽样 2.适用:如果群内各单位之间存在较大差异,群与群的结果相似,整群抽样会降低估计误差。 多阶段抽样 经过二个及二个以上抽样阶段,在大范围的抽样调查中,采用多阶段抽样是必要的。 【例】某城市为调查居民对市政建设的满意度,先从该市所有居委会中随机抽取20个居委会,再从每个被抽中的居委会中随机抽取30个居民家庭进行入户调查,该项调查采用的抽样方式是( )。 A.分层抽样 B.整群抽样 C.系统抽样 D.多阶段抽样 【答案】D【解析】通过本题掌握各种抽样方法的特点。通过题干可知,第一阶段采用整群抽样,第二阶段采用了简单随机抽样。所以本题所采用的抽样方法是多阶段抽样。 考点六:估计量的性质 关于估计量的性质如下表所示: 性质 内含 一致性 随着样本量的增大,估计量的值如果稳定于总体参数的真值。 无偏性 对于不放回简单随机抽样,所有可能的样本均值取值的平均值总等于总体均值。 有效性 在同一抽样方案下,对某一总体参数,如果有两个无偏估计量θ1、θ2,如果θ1的可能样本取值较θ2更密集在总体参数真值附近,则认为θ1比θ2更有效 考点七:抽样误差的估计 1.抽样误差无法避免,但是可计算的。 在不放回简单随机抽样方法中,将样本均值作为总体均值的估计量。则估计量的方差为: 样本量n总体方差S2样本估计量的方差= (1-)?总体个数N样本量n2.抽样误差的影响因素 (1)抽样误差与总体分布有关,总体单位值之间差异越大,即总体方差越大,抽样误差越大。 (2)抽样误差与样本量n有关,其他条件相同,样本量越大,抽样误差越小。 (3)抽样误差与抽样方式和估计量的选择也有关。例如分层抽样的估计量方差一般小于简单随机抽样。 (4)利用有效辅助信息的估计量也可以有效的减小抽样误差。 考点八:样本量的影响因素 影响因素 如何影响 调查的精度 要求的调查精度越高,所需要的样本量就越大。 总体的离散程度 在其他条件相同情况下,总体的离散程度越大,所需要的样本量也越大。 总体的规模 对于大规模的总体,总体规模对样本量的需求则几乎没有影响,但对于小规模的总体,总体规模越大,为保证相同估计精度,样本量也要随之增大(但不是同比例的)。 无回答情况 无回答减少了有效样本量,在无回答率较高的调查项目中,样本量要大一些,以减少无回答带来的影响。 经费的制约 样本量是调查经费与调查精度之间的某种折中和平衡。 其他 调查的限定时间,实施调查的人力资源等。 第二十五章 回归分析 考点一:回归分析与相关分析的关系 回归分析就是根据相关关系的具体形态,选择一个合适的数学模型,来近似的表达变量间的平均变化关系。回归分析与相关分析的关系: 联系 (1)它们具有共同的研究对象。 (2)在具体应用时,常常必须互相补充。 相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有高度相关时,进行回归分析寻求其相关的具体形式才是有意义的。 区别 相关分析与回归分析在研究目的和方法上具有明显的区别。 (1)相关分析研究变量之间相关的方向和相关的程度。 (2)回归分析是研究变量之间相关关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要方法。 考点二:一元线性回归模型 一、因变量Y??0??1X??,因变量Y是自变量X的线性函数(β0+β1X)加上误差项ε; 1.β0+β1X反映了由于自变量X的变化而引起的因变量y的线性变化。 2.误差项ε是个随机变量,表示除线性关系之外的随机因素对Y的影响,它是不能由X和Y的线性关系所解释的Y的变异性。 二、一元线性回归方程 描述因变量Y的期望值E(Y)如何依赖自变量X的方程称为回归方程。一元线性回归方程的形式:E(Y)=b0+b1X 一元线性回归方程的图示是一条直线,β0是回归直线的截距,β1是回归直线的斜率,表示X每变动一个单位时,E(Y)的变动量。 回归分析的一个重要应用就是预测,即利用估计的回归模型预估因变量数值。 考点三:最小二乘法 在现实中,模型的参数?0?1都是未知的,需要利用样本数据去估计,采用的估计方法是最小二乘法。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计?0?1的方法。 考点四:决定系数 2 决定系数,也称为R,可以测度回归直线对样本数据的拟合程度。 决定系数的取值在0到1之间,大体说明了回归模型所能解释的因变量变化占因变量总变化的比例。决定系数越接近1,回归直线的拟合效果越好。 2 R=1,说明回归直线可以解释因变量的所有变化。 2 R=0,说明回归直线无法解释因变量的变化,因变量的变化与自变量无关。 第二十六章 时间序列 考点一:时间序列的分类 时间序列含义:时间序列也称动态数列,是将某一统计指标在各个不同时间上的数值按时间先后顺序编制形成的序列。 绝对数时期序列 反映现象在一定时期内发展的结果(产时间序量、耗用量、销售额、财政收入等) 列 时点序列 反映现象在一定时点上的瞬间水平(期末职工人数、库存) 相对数统计指标值是相对数 时间序列 平均数统计指标值是平均数 时间序列 考点二:增长量与平均增长量 项目 计算 关系 增长量 报告期水平-基期水平 逐期增报告期水平-报告期前一期水平 同一时间序长量 列中,累计增长量等于累计增报告期水平-最初水平 相应时期逐长量 期增长量之和。 平均增逐期增长量的合计/逐期增长量个数 时间序列中长量 =累计增长量/(最末时间-最初时间) 逐期增长量的序时平均数。 考点三:平均发展水平 平均发展水平也称序时平均数或动态平均数,是对时间序列中各时期发展水平计算的平均数,它可以概括性描述现象在一段时期内所达到的一般水平。 序列 具体类别 平均数的计算 时期序列 简单算术平均数 时点连续时点 1.简单算术平均数(逐日登记逐日序列 (逐日登记) 排列)
2016年中级经济师经济基础知识总结笔记第二部分 财政 - 图文(8)
2020-06-03 14:39
2016年中级经济师经济基础知识总结笔记第二部分 财政 - 图文(8).doc
将本文的Word文档下载到电脑
下载失败或者文档不完整,请联系客服人员解决!