22 23 24 25 26 27 28 29 30 31 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 2 3 3 2 2 3 3 3 3 3 214.512 350.919 170.153 301.850 547.641 249.238 185.380 143.008 332.028 154.944
根据上面两个表格可知: K均值聚类分成的三类: 第一类为北京、上海、广东
第二类为天津、江苏、浙江、福建、重庆、云南、西藏
第三类为江西、陕西、河南、贵州、安徽、宁夏、吉林、黑龙江、辽宁、内蒙古、
山西、甘肃、河北、江西、山东、湖南、湖北、四川、广西、海南、宁夏、云南、贵州、青海
7.
最终聚类中心 食品 衣着 家庭设备用品及服务 医疗保健 交通和通讯 娱乐教育文化服务 居住 杂项商品和服务 1 3242.22 544.92 735.78 405.51 602.25 1016.62 760.52 446.83 聚类 2 2450.02 556.71 483.33 258.06 368.59 605.96 461.03 294.19 3 1643.98 458.55 318.33 216.77 250.22 493.58 372.99 196.88
3、 (28分)收集了某市工业部门13个行业的6项经济指标如下所列,原始数据见表3。
X1:年末固定资产净值,单位:万元; X2:职工人数,单位:人; X3:工业总产值,单位:万元; X4:全员劳动生产率,单位:元/人年; X5:百元固定资产原值实现产值,单位:元; X6:资金利税率,单位:%;
请对此案例进行因子分析,并回答以下问题:
(1) 请简要说明因子分析的目的。在什么情况下因子分析将失效?
(2) 本题中,按照特征值大于1的标准,应提取几个因子?所提取的因子对原数据表的
解释精度达到多少?
(3) 给出各变量的共同度。在因子分析中,共同度是用来反应什么的指标?
(4) 分别给出因子旋转前和旋转后的因子载荷矩阵。在因子分析中进行因子旋转的目的
是什么?
(5) 分别写出旋转后的因子分析模型表达式和计算因子得分的表达式。 (6) 根据所得到的因子分析模型解释各因子的含义。
(7) 对13个行业进行综合评价,给出综合排名的结果。(提示:根据所提取的因子得分,
按旋转后的因子贡献率加权,计算因子的综合得分。) 答: 1.
因子分析(factor analysis)和主成分分析的目的是一样的,即:将具有相关关系的多个变量综合为数量较少的几个因子,从而实现数据降维。
2. 解释的总方差 初始特征值 成份 1 2 3 4 合计 3.023 2.393 .437 .109 方差的 % 50.378 39.879 7.286 1.812 累积 % 50.378 90.257 97.544 99.356 合计 3.023 2.393 提取平方和载入 方差的 % 50.378 39.879 累积 % 50.378 90.257 合计 2.940 2.475 旋转平方和载入 方差的 % 49.004 41.253 累积 % 49.004 90.257 5 6 .035 .004 .586 .058 99.942 100.000 提取方法:主成份分析。
由图可知可提取两个因子,精度达到90.257
3.因子方差 初始提取年末固定资产净值1.000.972职工人数1.000.935工业总产值1.000.996全员劳动生产率1.000.788百元固定资产原值实现产值1.000.792资金利税率1.000.932提取方法:主成份分析。共同度描述了全部公共因子对变量的总方差所做的贡献,反映了公共因子对该变量的影响程度。也反映了变量对全部公共因子的共同依赖程度。 4.
成份矩阵 a 年末固定资产净值 职工人数 工业总产值 全员劳动生产率 百元固定资产原值实现产值 资金利税率 提取方法 :主成分分析法。 a. 已提取了 2 个成份。 1 成份 2 .275 .238 .445 .871 .742 .868 .947 .937 .894 -.171 -.492 -.422
成份矩阵a 成份 12年末固定资产净值.947.275职工人数.937.238工业总产值.894.445全员劳动生产率-.171.871百元固定资产原值实现产值-.492.742资金利税率-.422.868提取方法:主成分分析法。a.已提取了2个成份。 旋转后的矩阵:
旋转成份矩阵a 成份 12年末固定资产净值.982-.086职工人数.960-.117工业总产值.994.091全员劳动生产率.156.874百元固定资产原值实现产值-.190.870资金利税率-.080.962提取方法:主成分分析法。 旋转法:具有Kaiser标准化的正交旋转法。a.旋转在3次迭代后收敛。
旋转的目的是:当有些公共因子对多个变量都有较明显的影响作用。这时因子模型不利于突出主要矛盾和矛盾的主要方面,也很难对因子的实际背景进行合理的解释。这时通过因子旋转可以使它仅在一个公共因子上载荷较大,其余的载荷较小,有利于突出每个公共因子和其载荷较大的变量的联系,显示公共因子的主要性质。 5 .旋 旋转成份矩阵 a 年末固定资产净值 职工人数 工业总产值 全员劳动生产率 百元固定资产原值实现产值 资金利税率 提取方法 :主成分分析法。 1 成份 2 -.086 -.117 .091 .874 .870 .962 .982 .960 .994 .156 -.190 -.080 旋转法 :具有 Kaiser 标准化的正交旋转法。 a. 旋转在 3 次迭代后收敛。
转后的因子分析模型表达式和计算因子得分的表达式。X1=0.982F1-0.086F2X2=0.96F1-0.117F2X3=0.994F1+0.091F2X4=0.156F1+0.874F2X5=-0.19F1+0.87F2X6=-0.08F1+0.962F2
成份得分系数矩阵 年末固定资产净值 职工人数 工业总产值 全员劳动生产率 百元固定资产原值实现产值 1 成份 2 -.006 -.019 .066 .360 .348 .334 .325 .343 .079 -.040 资金利税率 提取方法 :主成分分析法。 .001 .389 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。
成份得分系数矩阵 成份 12年末固定资产净值.334-.006职工人数.325-.019工业总产值.343.066全员劳动生产率.079.360百元固定资产原值实现产值-.040.348资金利税率.001.389提取方法:主成分分析法。 旋转法:具有Kaiser标准化的正交旋转法。 构成得分。 计
算
因
子
得
分
的
表
达
式
:
F1=0.334X1+0.325X2+0.343X3+0.079X4-0.04X5+0.001X6F2=-0.006X1-0.019X2+0.066X3+0.36X4+0.348X5+0.389X6 6. 旋转成份矩阵 a 年末固定资产净值 职工人数 工业总产值 全员劳动生产率 百元固定资产原值实现产值 资金利税率 提取方法 :主成分分析法。 1 成份 2 -.086 -.117 .091 .874 .870 .962 .982 .960 .994 .156 -.190 -.080 旋转法 :具有 Kaiser 标准化的正交旋转法。 a. 旋转在 3 次迭代后收敛。
.旋转成份矩阵a 成份 12年末固定资产净值.982-.086职工人数.960-.117工业总产值.994.091全员劳动生产率.156.874百元固定资产原值实现产值-.190.870资金利税率-.080.962提取方法:主成分分析法。 旋转法:具有Kaiser标准化的正交旋转法。a.旋转在3次迭代后收敛。 显然,F1和年末固定资产净值、职工人数、工业总产值相关性较高,因此可解释为生产规模指标,决定工厂的生产规模 F2和全员劳动生产率、百元固定资产原值实现产值、资