由输出4.2:
由于数据太多,又因为经过前面(见输出4.1)的分析,可知选取3个主成分
足够。因此这里只给出前面7个主成分的相关阵的特征值和特征向量。
通过相关阵的特征值和特征向量,可以得到主成分函数,例如:
**************Z1?0.2082X1?0.1204X2?0.2293X3?0.2441X4?0.2331X5?0.2274X6?0.2474X7?0.2487X8?0.2378X9?0.2436X10?0.2314X11?0.2172X12?0.2411X13?0.2498X14?0.1165X15?0.2497X16?0.2555X17?0.2530X18?0.2419X19*****
表4.1 指标分类结果 主成分 影响指标 农、林、牧、渔业,电力、燃气及水的生产和供应业,建筑业,交通运输、仓储和邮政业,信息传输、计算机服务和软件业,批发和零售业,金融业,Z1 房地产业,科学研究、技术服务和地质勘查业,水利、环境和公共设施管理业,教育,卫生、社会保障和社会福利业,文化、体育和娱乐业,公共管理和社会组织 Z2 Z3
输出4.3
采矿业,居民服务和其他服务业 制造业,住宿和餐饮业,租赁和商务服务业
由输出4.3:
根据Z1、Z2、Z3三个主成分,可以得到个地区工资水平受影响的指标分类情况
如表4.2:
表4.2 主成分 Z1 Z2 Z3
输出4.3 第二主成分得分对第一主成分得分的散布图
地区 福建、西藏、江苏、广东、浙江、天津、北京、上海 山西、吉林、甘肃、云南、江西、贵州、黑龙江、河南、广西、安徽、海南、陕西、宁夏、新疆、 河北、湖南、黑龙江、湖北、四川、辽宁、内蒙古、山东、青海、重庆、
由输出4.3:
可以看出31个地区可以分为三类(以第一主成分得分分值为2和6为分界点),
天津、北京、上海为一类,广东、江苏、浙江、西藏为一类,其余为一类。得到结果与聚类分析得到结果基本一致。
五、 因子分析
因子分析是主成分分析的推广和发展,同样是运用降维的思想。主要研究关阵或协方差阵的内部依赖关系,将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系。前面的Ward法聚类分析及主成分分析虽然将我国各地区按行业分城镇单位就业人员平均工资水平分为三类到四类,但仍然存在一定的缺陷。通过因子分析,希望找出几个真正影响各区城镇单位就业人员平均工资水平的公共因子。下面是因子分析的过程。
输出5.1
由输出5.1:
前三个公共因子的累计贡献率为87.67%,即前三个公共因子反应原始变量信息
输出5.2 因子载荷矩阵
量已经占到总信息量的87.67%。
输出5.3 转换后因子载荷矩阵
输出5.4 最终公因子方差估计
由输出5.3:
经过最优斜交转换法旋转变换的因子载荷矩阵以及每个公告因子解释的方差可知,x1、x4、x5、x6、x7、x11、x13、x14、x16、x17、x18、x19解释了Factor1; x2、x3、x8、x10、x12解释了Factor2;x9、x15解释了Factor3。 这里例举三个因子模型:
X1?0.87901F1+0.26694F2?0.08705F3X2?0.21140F1+0.76280F2?0.18589F3 X3?0.55045F1+0.75104F2?0.19567F3表5.1 公共因子 影响指标 农、林、牧、渔业,电力、燃气及水的生产和供应业,建筑业,交通运输、仓储和邮政业,信息传输、计算机服务和软件业,房地产业,科学研究、技术服务和地质Factor1 勘查业,水利、环境和公共设施管理业,教育,卫生、社会保障和社会福利业,文化、体育和娱乐业,公共管理和社会组织 Factor2 Factor3
采矿业,制造业,批发和零售业,金融业,租赁和商务服务业 住宿和餐饮业,居民服务和其他服务业