10 46.98910 江苏 3 11 45.69279 浙江 4 13 45.67545 福建 5 2 45.49443 河北 6 19 45.42103 广东 7 14 44.84118 江西 8 9 44.47630 上海 9 1 44.19970 北京 10 31 43.89986 新疆 11 30 43.89648 宁夏 12 6 43.85077 辽宁 13 22 43.84919 重庆 14 12 43.81336 安徽 15 20 43.65408 广西 16 17 43.41939 湖北 17 4 42.94670 山西 18 27 42.73741 陕西 19 18 41.22774 湖南 20 29 40.63502 青海 21 21 40.16107 海南 22 23 40.02236 四川 23 7 39.94659 吉林 24 5 39.33251 内蒙古 25 8 39.01378 黑龙江 26 25 38.63829 云南 27 28 37.48472 甘肃 28 16 36.96833 河南 29 26 36.29778 西藏 30 24 35.74812 贵州 31
上面的结果中,rank列为排名,从上到下按得分从大到小排序。此结果可能会有些许疑问,那就是北京上海等强势地区为何排名却少许靠后。从数据方面来看,我们可以看到例如X3每万人拥有公共交通车辆,X4人均城市道路面积,X5人均公园绿地面积,X6每万人拥有公共厕所的数量等这些涉及到人均或者人口数量的指标对于人口十分密集的地区来说得分应该不会太高,因为北京上海这种人口十分密集的地区虽然强势,但是排名却不是十分靠前。
5、因子分析
问题重述:利用因子分析方法分析下列30个学生成绩的因子构成,并分析各个学生较适合学
文科还是理科。
代码如下:
10
library(psych);
data<-read.csv(\correlations<-cor(data); #计算相关系数矩阵
fa<-fa(correlations,nfactors=2,rotate=\ #设定因子数为2,采用正交旋转进行因子分析 ###画出因子图形
factor.plot(fa,labels=rownames(fa$loadings)); fa.diagram(fa,simple=FALSE); data<-as.matrix(data);
faFs<-data%*ú$weight; #计算因子得分 outcome<-c(); for(i in 1:30){
ifelse((faFs[i,1]>faFs[i,2]),outcome<-c(outcome,\文科\理科\ };
outcome<-as.vector(outcome); #根据得分决定文理科 result<-cbind(data,outcome);
运行结果及分析:
从图上我们看出数学物理化学在第二个因子上载荷较大,语文英语历史在第一个因子载荷上较大,因此我们也就可以将第一个因子和第二个因子理解成日常中的文科和理科
接下来根据每个学生的因子得分比较来分析该学生适合文科还是理科,结果如下:
11
> result
数学物理化学语文历史英语 outcome
[1,] \ \ \文科\ [2,] \ \ \文科\ [3,] \ \ \文科\ [4,] \ \ \文科\ [5,] \ \ \文科\ [6,] \ \ \文科\ [7,] \ \ \文科\ [8,] \ \ \文科\ [9,] \ \理科\ [10,] \ \ \理科\ [11,] \ \ \文科\ [12,] \ \ \文科\ [13,] \ \ \理科\ [14,] \ \ \理科\ [15,] \ \ \文科\ [16,] \ \ \文科\ [17,] \ \ \文科\ [18,] \ \ \文科\ [19,] \ \ \文科\ [20,] \ \ \文科\ [21,] \ \ \理科\ [22,] \ \ \文科\ [23,] \ \ \文科\ [24,] \ \ \文科\ [25,] \ \ \理科\ [26,] \ \ \文科\ [27,] \ \ \理科\ [28,] \ \ \文科\ [29,] \ \ \理科\ [30,] \ \理科\
6 相应分析
问题重述:费希尔研究头发颜色与眼睛颜色的关系,抽查了5387人的资料如下表,试对其进行相
应分析。数据见压缩包。
代码如下:
library(ca);
data<-read.csv(\data1<-as.matrix(data[,2:6]);
12
rownames(data1)<-data[,1]; ca<-ca(data1); plot(ca);
运行结果及分析:
> ca
Principal inertias (eigenvalues):
1 2 3 Value 0.198294 0.030622 0.009021 Percentage 83.34% 12.87% 3.79%
Rows:
蓝色淡蓝浅蓝深蓝
Mass 0.127616 0.295217 0.331465 0.245703 ChiDist 0.500912 0.457501 0.245240 0.710949 Inertia 0.032020 0.061791 0.019935 0.124190 Dim. 1 -0.914587 -0.986518 0.068155 1.568406 Dim. 2 -1.196517 -0.406410 1.378854 -0.750370
Columns:
金黄色红色褐色深红黑色
Mass 0.271861 0.046898 0.399290 0.259903 0.022048 ChiDist 0.580403 0.459708 0.207929 0.592499 1.125736 Inertia 0.091581 0.009911 0.017263 0.091240 0.027941 Dim. 1 -1.234421 -0.323621 -0.107735 1.307839 2.443530 Dim. 2 -1.061472 0.661904 1.137227 -0.620082 -1.605231
13
从结果我们可以看出眼睛颜色与头发颜色这两个变量之间的关系为:淡蓝色和蓝色的眼睛与金黄色的头发有较大关联;浅蓝色的眼睛和红色还有褐色的头发有较大的关联;深蓝色的眼睛与深绿还有黑色的头发有较大的关联。
14