多元统计分析作业--硕士研究生(4)

2020-12-05 00:25

子部分,对于所研究的问题就可试图用最少个数的不可观测的公共因子的线性函数与特殊因子之和来描述原来观 测的每一分量。 因子分析的一般模型如下: X 1 a11 F1 a12 F2 a1m Fm 1 X a F a F a F 1 21 1 22 2 2m m 2 X p a p1 F1 a p 2 F2 a pm Fm p 一般而言,m 远少于 p,m 的选取一般根据相关系数矩阵特征根大于 1 的个数来确定。其中因子分析的出发点 是相关系数矩阵,上述因子载荷系数 aij 可以基于主成分法、主轴因子法、极大似然法、综合最小平方法或 a 因 子法等方法进行估计。通过回归法或 Bartlett 法等建立公共因子与原始变量的线性组合,从而求得各因子的得 [1] 分 。 2.2.1 因子分析的步骤 1. 2. 3. 4. 5. 将原始变量数据进行标准化处理 Zi X i i ii;计算标准化指标的相关系数矩阵 R ; 求解相关系数矩阵 R 的特征向量 u (uij ) p p 和特征值 1 2 p 0 ; 确定公共因子的个数,设为 m 个,即选择特征值 1的个数 m 或根据累积方差贡献率 85%的准则所确定的 个数 m 为公共因子个数; 求解初始因子载荷矩阵 A (aij ) p p (uij j ) p p ;3 数据分析3.1 案例背景及数据来源 在工业行业经济效益评价中, 设计的指标往往很多。 为了简化系统结构, 抓住经济效益评价中的主要问题, 我们可由原始数据矩阵出发求综合因子。 在对河南省独立核算的 39 个国有控股工业行业的经济效益评价中, 设 计 5 项指标。其中总资贡献率、资产负债率、流动资产周转次数(次/年)、成本费用利润率、产品销售率产存在 明显的相关性,数据所蕴含的信息量在一定程度上存在较大的重叠和冗余,在对工业行业实际综合评价过程中, 变量间的信息的高度重叠和高度相关仍然会给统计方法的应用设置许多障碍。此外,收集的变量角度,如果这些 变量都参与数据建模,无疑会增加分析过程中的计算工作量。 也正基于此,我们首先通过主成分分析和因子分析法,再次对各工业行业的经济效益进行分析与评价,并结 合聚类分析法来验证综合评价的结果。 论文采用数据来源于 2014 年河南统计年鉴,附表表 1。 3.2 指标选取及说明 反映经济效益的指标较多,不同文献中选取的指标不尽相同。本文采用国家统计局最新公布的五个指标:总 资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率和产品销售率,分别记为 X1 至 X5。 总资产贡献率(X1)反映企业全部资产的获利能力。资产负债率(X2)既反映企业经营风险的大小,也反映企 业利用债权人提供的资金从事经营活动的能力。流动资产周转次数(X3)反映投入工业企业流动资金的周转速度。 成本费用利润率(X4)反映企业投入的生产成本及费用的经济效益。产品销售率(X5)反映工业产品已实现销售 的程度。 3.3 基于主成分分析的综合评价 尽管数据的标准化处理可能会抹杀原始指标离散程度的差异,但考虑到各指标的量纲不尽相同,而且各指标 的方差差异显著。因此,为了提取经济效益的综合指标,本文将对标准化数据进行主成分分析。 3.3.1 考察原始变量是否适合进行因子分析 原始变量之间必须存在相关性,否则无法用主成分分析法来进行数据降为。 从下表 3-1 可知,这 5 项指标之间存在较强的相关性,变量 X1 和变量 X2、X4、X5 有显著地相关关系,变量 X2 和变量 X1、X4、有显著地相关关系,变量 X3 和变量 X2、X4 有显著地相关关系,变量 X4 和变量 X2、X3、X5- 4 -


多元统计分析作业--硕士研究生(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:Poisson 泊松方程的差分方法matlab实现

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: