步骤 1 Y 0 1 总计百分比 步骤 2 Y 0 1 总计百分比 a. 切割值为 .500 0 31 1 1 2 32 93.9 97.0 95.5 1 32 97.0 97.0 97.0 32 1 而且从上表知道总的预测百分比为97%,没有变化,所以这一步较之前的强行进入的方法没什么优化,也就是没什么必要用向前的方法做。
所以有最优的一个Logistic回归模型为 模型方程:
p{Y?0}ln()=-10.334-0.336X1?0.180X2?4.160X3 1?p{Y?0}Logistic回归方程: P{Y=0}=
exp(-10.334-0.336X1?0.180X2?4.160X3)1?exp(-10.334-0.336X1?0.180X2?4.160X3)
三、为了研究几个省市的科技创新力问题,现在取了2005年8个省得15个科技指标数据,试用因子分析方法来分析一个省得科技创新能力主要受到哪些潜在因素的影响。数据见8个省市的科技指标数据.sav,其中各个指标的解释如下:(25分)
X1:每百万人科技活动人员数(人/万人)
X2: 从事科技活动人员中科学技术、工程师所占比重(%) X3 :R&D人员占科技胡哦哦的呢人员的比重(%) X4:大专以上学历人口数占总人口数的比例(%) X5 :地方财政科技拨款占地方财政支出的比重(%) X6:R&D经费占GDP比重(%)
X7:R&D经费中挤出研究所占比例(%) X8:人均GDP(元/人)
X9:高科技产品出口额占商品出口额的比重(%) X10: 规模以上产业增加值中高技术产业份额(%)
X11 :万名科技人员被国际三大检索工具收录的论文数(篇/百万人) X12 :每百万人口发明专利的授权量(件/百万人)
X13:发明专利申请授权量占专利申请授权量的比重(%) X14 :万人技术市场成交合同金额(万元/万人) X15 :财政性教育经费支出占GDP比重(%) 解:
解释的总方差 原始 成份 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 重新标度 1 2 3 4 5 6 7 8 9 合计 初始特征值 方差的 % 99.636 .362 .002 .000 8.453E-5 2.379E-5 5.711E-6 2.165E-17 1.061E-18 7.210E-21 5.860E-22 -4.778E-23 -5.377E-21 -9.514E-20 -4.565E-18 99.636 .362 .002 .000 8.453E-5 2.379E-5 5.711E-6 2.165E-17 1.061E-18 累积 % 99.636 99.997 100.000 100.000 100.000 100.000 100.000 100.000 100.000 100.000 100.000 100.000 100.000 100.000 100.000 99.636 99.997 100.000 100.000 100.000 100.000 100.000 100.000 100.000 合计 a提取平方和载入 方差的 % 99.636 累积 % 99.636 1.427E8 517846.046 3265.489 201.762 121.066 34.078 8.179 3.101E-11 1.520E-12 1.033E-14 8.393E-16 -6.843E-17 -7.700E-15 -1.363E-13 -6.538E-12 1.427E8 517846.046 3265.489 201.762 121.066 34.078 8.179 3.101E-11 1.520E-12 1.427E8 8.388 55.921 55.921 10 11 12 13 14 15 提取方法:主成份分析。 1.033E-14 8.393E-16 -6.843E-17 -7.700E-15 -1.363E-13 -6.538E-12 7.210E-21 5.860E-22 -4.778E-23 -5.377E-21 -9.514E-20 -4.565E-18 100.000 100.000 100.000 100.000 100.000 100.000 a. 分析协方差矩阵时,初始特征值在整个原始解和重标刻度解中均相同。 上表是用协方差矩阵分析法分析出的总方差的结果,由上表知道,初始特征值间所占的比例相差很大,取值范围差异大,所以不大适合做协方差的矩阵分析。所以应该采用相关矩阵的方法分析如下:
相关矩阵 a 相X1 关 X2 X1 1.000 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 .857 .893 .943 .373 .988 .988 .756 .172 .520 .914 .989 .883 .984 .806 .857 1.000 .863 .882 .573 .841 .844 .776 .209 .586 .839 .912 .722 .905 .769 X3 .893 .863 1.000 .830 .191 .930 .922 .525 .210 .613 .720 .888 .834 .907 .629 X4 .943 .882 .830 1.000 .441 .911 .948 .874 .318 .563 .976 .971 .903 .934 .883 X5 .373 .573 .191 .441 1.000 .278 .300 .713 .245 .397 .545 .440 .081 .392 .592 X6 .988 .841 .930 .911 .278 1.000 .985 .665 .125 .480 .867 .969 .881 .983 .759 X7 .988 .844 .922 .948 .300 .985 1.000 .737 .275 .590 .895 .978 .905 .972 .767 X8 .756 .776 .525 .874 .713 .665 .737 1.000 .458 .574 .916 .818 .626 .752 .802 X9 .172 .209 .210 .318 .245 .125 .275 .458 1.000 .811 .256 .213 .141 .160 .069 X10 X11 X12 X13 X14 X15 .520 .586 .613 .563 .397 .480 .590 .574 .811 1.000 .454 .548 .432 .498 .312 .914 .839 .720 .976 .545 .867 .895 .916 .256 .454 1.000 .943 .830 .905 .925 .989 .912 .888 .971 .440 .969 .978 .818 .213 .548 .943 1.000 .876 .988 .834 .883 .722 .834 .903 .081 .881 .905 .626 .141 .432 .830 .876 1.000 .838 .781 .984 .905 .907 .934 .392 .983 .972 .752 .160 .498 .905 .988 .838 1.00.778 0 .806 .769 .629 .883 .592 .759 .767 .802 .069 .312 .925 .834 .781 .778 1.000 a. 此矩阵不是正定矩阵。 上表是15个变量间的相关系数矩阵,可以看出相关系数都比较高,比如X1(每百万人科技活动人员数(人/万人))和X2(从事科技活动人员中科学技术、工程师所占比重(%))的相关系数0.859,接近1,呈较强的的线性相关性,所以能够从中提取公因子,适合做因子分析 解释的总方差 初始特征值 成份 1 2 3 4 5 6 7 8 合计 11.136 1.706 1.247 .508 .205 .125 .074 3.059E-16 方差的 % 74.237 11.371 8.316 3.386 1.365 .832 .493 2.040E-15 累积 % 74.237 85.608 93.924 97.310 98.675 99.507 100.000 100.000 合计 11.136 1.706 1.247 提取平方和载入 方差的 % 74.237 11.371 8.316 累积 % 74.237 85.608 93.924 9 10 11 12 13 14 15 1.532E-16 1.188E-16 4.537E-17 -2.301E-16 -3.671E-16 -4.891E-16 -8.277E-16 1.021E-15 7.923E-16 3.025E-16 -1.534E-15 -2.448E-15 -3.261E-15 -5.518E-15 100.000 100.000 100.000 100.000 100.000 100.000 100.000 提取方法:主成份分析。 由表可知,前两个因子的特征根值很高,累积方差贡献率为分别为85.608(>=80%即可),对解释原有变量的贡献很大,第3个以后的因子特征根值都很小,对解释原有变量的贡献很校,可以忽略,因此提取第一和第二个因子比较合适,基本能表达所有信息。有特征值?1=11.136 ?2=1.706
成份矩阵 成份 a 1 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 .973 .919 .883 .985 .482 .947 .972 .849 .300 .611 .955 .992 .876 .968 2 -.158 .036 -.161 -.004 .497 -.242 -.108 .340 .834 .637 -.001 -.091 -.282 -.156