综合变量法在多目标分层抽样中的应用(2)

2019-04-22 09:02

抽样的,但是这个结论并不是确定的,也会有特殊情况出现。

综上,综合变量法和简单分层比较来看,在费用方面,两种方法没有什么区别,它们都是将总体划分成了L1层,而后在层中进行简单随机抽样。在精度方面,综合变量法可能会有更大的优势,通常情况下,综合变量法会比简单分层抽样更优。

四、案例分析

本文研究的两种方法都是基于主成分综合的,因此,首先将原数据进行主成分变换,原变量X1,X2,X3,X4主成分变换为F1,F2,F3,F4,表达式如下:

F1?a11X1?a12X2?a13X3?a14X4F2?a21X1?a22X2?a23X3?a24X4F3?a31X1?a32X2?a33X3?a34X4F4?a41X1?a42X2?a43X3?a44X4

使用SPSS19.0对数据进行相关性分析,从表5.1可以看出指标之间存在着一定的相关性,需要通过主成分分析法将相关的指标转换为相互独立的指标,主成分分析得到的 表5.2解释的总方差表,这里保留了所有主成分,四个主成分的方差贡献率分别为38.849%、24.984%、22.802%和13.366%,由表5.3成分矩阵表可以得到结果如下:

(5-1)

F1?0.821X1?0.781X2?0.355X3?0.379X4F2?0.103X1?0.186X2?0.789X3?0.577X4F3??0.213X1?0.343X2?0.475X3?0.723X4F4??0.52X1?0.487X2?0.162X3?0.029X4

由此便得到了变换之后的主成分数据。

表5.1 相关系数表

食品

相关

衣着 居住 交通和通信 食品

Sig.(单侧)

衣着 居住 交通和通信

食品 1.000 .442 .187 .113 .000 .000 .000

衣着 .442 1.000 .046 .142 .000 .039 .000

居住 .187 .046 1.000 .019 .000 .039 .232

交通和通信

.113 .142 .019 1.000 .000 .000 .232

(5-2)

表5.2 解释的总方差表

初始特征值

成份 1 2 3 4

合计 1.554 .999 .912 .535

方差的 % 38.849 24.984 22.802 13.366

累积 % 38.849 63.833 86.634 100.000

合计 1.554 .999 .912 .535

提取平方和载入 方差的 % 38.849 24.984 22.802 13.366

累积 % 38.849 63.833 86.634 100.000

提取方法:主成份分析

表5.3 成份矩阵表

1

食品 衣着 居住 交通和通信

提取方法:主成份分析

成 份 2 .103 -.186 .789 -.577

3 -.213 -.343 .475 .723

4 -.520 .487 .162 -.029

.821 .781 .355 .379

表5.4 超空间区域法均值及比较 食品(X1) 衣着(X2) 居住(X3) 交通和通信(X4)

总体均值 6997.34 2206.24 1980.95 2329.39

样本均值 6997.77 2148.96 1920.08 1852.00

相对误差(%)

0.006 -2.596 -3.073 -20.494

标准差 2651.37 1411.33 3513.61 1753.25

综合变量法也是基于主成分分析的抽样设计方法,由式5-2和表5.2中的方差贡献率可以求出综合变量F*的值,而后以F*作为分层标志,为方便与超空间区域法进行对比,在该方法下,将总体分为16层,临界值同样采用快速近似法确定,每一层的个数为

Ni?90(i?1,?,15),N16?100,按照10%的抽样比进行抽样后,各层的样本数分别为ni?9(i?1,?,15),n16?10,运用SPSS19.0里的复杂抽样功能进行一次抽样后有表5.5所示结论。

表5.5 综合变量法均值及比较

食品(X1) 衣着(X2) 居住(X3) 交通和通信(X4)

总体均值 6997.34 2206.24 1980.95 2329.39

样本均值 7004.46 2107.55 1752.32 1762.20

相对误差(%)

0.102 -4.473 -11.541 -24.349

标准差 2897.92 1693.09 1328.44 1262.34

五、结论

本文所研究的抽样方法是基于主成分分析方法而设计的超空间区域法和综合变量法,介绍了两种抽样方法的实施过程,粗略地说明了两种的优势和劣势,为多目标分层抽样理论提供了一个新的思路,其创新之处表现为:

一、证明了W.G.Cochran的Vprop?Vran的结论在多变量抽样中同样有效。 二、采用了多元统计分析中的主成分分析方法研究多目标分层抽样。 三、丰富了多目标分层抽样方法。

本文试图将辅助信息充分利用到分层抽样的抽样设计阶段,通过主成分变换实现了这一目标,取得了一定的效果,但仍然存在很多未解决的问题。

参考文献

[1]冯士雍,施锡铨.抽样调查理论、方法与实践[M].上海:上海科学技术出版社 , 1996,54-99.

[2]何晓群.多元统计分析[M].北京:中国人民大学出版社,2009,152-190.

[3]施锡铨.抽样调查的理论与方法[M]. 上海:上海财经大学出版社,1996, 44-63. [4]金勇进,杜子芳,蒋 妍.抽样技术[M].北京:中国人民大学出版社,2008,75-132, 239-261

[5]刘建平.辅助信息在抽样调查中的应用模型与方法[M].中国统计出版社,2007,89-108 [6]刘建平,陈光慧.通过对辅助变量的线性转化来改进比率估计[M].统计研究,2006,69-71 [7]刘建平,陈光慧.MPPS抽样下Hansen-Hurwitz估计量的扩展[J]统计研究, 2005,50-52. [8]刘建平,陈光慧.辅助信息在二重抽样中的应用[J].理论新探.2006第3期,16-17. [9]林才生. 多目标分层次复合抽样设计研究[D].2006.

[10]卢山.迭代方法在多目标总体抽样调查中的应用[J].统计研究,2005,53-57

[11]刘建平, 陈光慧. 利用辅助信息提高事后分层估计量的精度[J]. 理论新探,2007.11-13. [12]彭念一,陈 曜.对分层抽样设计的改进[J].统计研究,2001年第3期51-54.

[13]庞新生.多目标双重事后分层抽样中辅助变量的选择[J].统计与信息论坛2001第45期,63-64,77.

[14]魏利东,闰在在,洪志敏.以多辅助指标线性组合为辅助信息的比估计法[J].数理统计与管理, 2009 ,443-448.

[15]王学民.多指标分层抽样中样本容量折衷分配的加权方法[J].理论新探,2006,27.

[16]王佐仁,张维群,耿宏强. 高低成本指标广义相关下的多目标复合抽样方法的设计与应用[J]. 统计与信息论坛,2004,22-26.

[17]王国明,石庆焱.成本条件下多目标复合抽样设计[J].统计研究.2002第11期17-20. [18]魏航,陈沁群.多变量分层抽样技术的改进与应用[J].科学技术与工程.2010第12期2980-2983.

[19]肖玲. 多主题分层抽样的分层技术[J].统计研究,1994,74-76.

[20]俞纯权. 多指标目录抽样的排列标识与最优分界点[J].广西商专学报,1993. [21]张维群. 多目标抽样调查的模型选择[J]. 统计理论与方法,1999,39-42.

[22]张维群.均匀设计在多指标抽样调查方案设计中的应用[J].统计与信息论坛.2009, 第10 期,18-23.

[23]曾五一.统计调查体系与调查方法问题研究[M].中国统计出版社.2009,84-122

[24]W.G. 科克伦著 张尧庭、吴辉译.《抽样技术》[M]. 北京:中国统计出版社,1985. [25] Bengt Rosen. On sampling with probability proportional to size. Journal of Statistical Planning and Inference 62 (1997) 159-191.

[26] Kuk,A.Y.C..A .Kernel Method for Estimating Finite Population Distribution Functions Using Auxiliary Information.Biometrika.1993

[27] Sen, P.K., 1953.On the estimate of the variance in sampling with varying probabilities. [J]. Indian Soc.Agricultural Statist. 5, 119–127.

[28] Sengupta . S. 1989. On Chao’s unequal probability sampling plan [J]. Biometrika 76: 192–196.

[29] Wu Chang Hun, Zhang Run Chu. Empirical Likelihood Method under Stratified Random Sampling Using Auxiliary Information and the Information in the Strata Population Size. Chinese Journal of Applied Probability and Statistics V61.22 No.4 Nov.2006.

[30]张勇,周魏,涂玉娟.MPPS 抽样设计方差估计的比较研究[J].统计研究,2006,(4): 64-68.

[31]虞明娟.多目标抽样若干问题探讨[D].2007.1.

[32] On Two Different Aspects of the Representative Method: The Method of Stratified Sampling and the Method of Purposive Selection

[33] Ratio Estimation and Finite Populations: Some Results Deducible from the Assumption of an Underlying Stochastic Process

[34] Some Results on Generalized Difference Estimation and Generalized Regression Estimation for Finite Population

[35]刘红英,关于多目标分层抽样方法及其应用研究


综合变量法在多目标分层抽样中的应用(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:第一章 光的干涉 习题

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: