等),但由于在插补类均值这一点形成一个人为的“峰值”,从而破坏了分布状态和变量之间的关系,因此,如果用常规的抽样方差公式进行计算,就会低估最终的方差。
10. 离群值的检验可以看作审核的一种类型,主要是用来发现和确认可疑的记录。离群
值被定义为一个观察值或一组观察值,他们看起来与数据中的其他观察值不一致。 11. 集中趋势的另一个度量是中位数。对与样本数据中位数是加权数据的中间值,如果
数据个数为偶数,中位数是最中间两个数值的平均数。中位数即可用于定量数据,也可用于定序数据。而且对于有序数据来说,中位数是刻画集中局势最好的度量。 12. 与均值相比,中位数的主要优点在于它更少受极端值的影响。 13. 集中趋势的最后一个度量是众数。
14. 如果一个分布是双峰的,则在解释数据的集中趋势度量是要特别小心,均值和中位
数都可能导致误解。在这种情况下,有两个众数,给出这两个众数可以很好的地解释数据分布中存在的两个峰值。
15. 在统计分析中,有时还是用其他统计量。雨中位数一样,四分位数也是一个位置度量,
16. 有时候,泄密控制会对数据的质量产生负面影响,因为有些数据低不到发表或必须进行修改(通过舍入数据、合并类别、排除小数格等)。泄密控制是为了确保被调查者的个人隐私受到尊重,与此同时最大程度地保持数据的效用。 17. 调查中的泄密主要有两种类型:身份泄密和归属泄密。
18. 由于普查(全面调查)的调查结果通常没有或然性,所以归属泄密经常发生在普查
中。例如在某一地区医生收入的全面调查中提供了过于狭窄的范围。 19. 调查的步骤与过程:一,调查的计划与设计二,调查前的准备三,调查的实施四,调查结果
的分析与报告
20. 进行全面调查还有一些其他原因,其中之一是为以后的抽样调查提供抽样框
21. 值得注意的是:全面调查和抽样调查并不是完全对立的,根据具体调查的需要,可将这两种调查方法结合起来使用
22. .调查总体即实际调查所覆盖的总体.在抽样调查中称作被抽样的总体.
23. 非抽样误差不仅出现在抽样调查中,也出现在全面调查中.
24. 效率原则:在同样完成调查要求的前提下,问卷设计应保证效率尽可能高.也就是说,要
在获得同样信息的前提下,应选择最简洁的调查方式,以使问卷的长度和题量达到最小.
25. 关于态度的度量方法:要对这种有关态度问题的精度量是比较困难的,通常只能采取打分或评定等级进行排序的方法。 26. 样本的抽选概率与抽样比(看看P81)
27. 介绍Deff指标(熟悉P84)
28. 圆形系统抽样:如果N不能被n整除,则可以使用圆形系统抽样法来避免出现可能
样本量不一致的情况。我们把总体单元假想排列在一个圆上,并采用模余数法。 29. 整群抽样的具体方法:整群抽样包括两步过程,首先将总体划分为群,然后抽选群
的样本,再调查样本群中的所有单元。 30. 抽样方差的大小与样本量的关系:如果其他因素不变,抽样方差的大小一般随着样
本量的增大而减少。然而,为获得给定的方差,所需的样本量并不随总体大小的增大而等比例增加。实际上,在确定给定抽样方差所需的样本量时,对中等规模的总体来说,总体大小仅起有限的影响;而对大的总体则几乎没有影响。
31. 样本量和精度之间的关系:随着抽样方差的不断减小,估计值的精度就会逐渐提高,
而估计值的精度越高,所需的样本量相应也就越大。
32. 精度的表示方法:我们一再提到精度是用调查估计值的抽样方差或抽样误差来表示
的,抽样方差或抽样误差越小,精度越高。调查估计值的精度与样本量时密切相关的,随着样本量的增加调查估计值的精度也会不断提高。换句话说,对应估计量的抽样方差就会不断减小。所以,样本量取决于调查估计值所要求的精度。 33. P149表:注意此表中,当样本量从50加一倍增到100时,比例估计值的误差限有所
降低,从±0.14减少到±0.10,并没有如我们可想象的那样,减半至±0.07。同样,
对于500的样本量,或者5倍于100的样本量,误差限也只是减少到±0.045,也没有与样本量增加5倍相对应的,减少到原来的1/5,即从±0.1减少到±0.02。最后,样本量从500增加到1000时误差限也没有减少一半。
34. 总体指标的变异程度何时最大:对于只取两个值的指标,即二元变量,则当这两个
值在总体中以50%和50%的比例出现时,总体指标的变异程度最大。
35. 如何确保达到调查要求的精度:为确保达到调查要求的精度,在计算样本量时,建
议对某一指标的总体变异程度采取较为保守的估计。换句话说,在实际中如果事先
不知道调查中要测量指标变异程度的数据,那么最好的办法是假定研究指标具有最大的变异程度。例如对于二元变量,应该假定总体中该变量的变异程度为50%和50%对半平分,即假定P=0.5。
36. 总体大小的作用:在样本量确定过程中,人们常常以为总体越大,应抽的的样本就
应该大,其实总体所起的作用因它的大小而有所差异。对于小规模总体,它起着重要作用;对于中等规模的总体,其作用也是中等,而大总体的作用很小。
37. P152表:由表可知,为满足要求的精度水平,随着总体大小的增加,样本量增加的比率逐渐减小到零。
38. 公关工作包括一些大型调查的宣传活动,也包括在小规模调查使用的致被调查者的
信、调查手册和一般机构介绍等各种宣传资料。为使被调查者了解调查的意义并能够和调查人员积极合作,一项调查应当开展群众性的宣传活动 39. 实际调查中很多情况下都需要对调查的单位进行寻踪,即在现场操作时仅根据抽样
框的信息还不能对样本单元定位,因此需要进一步寻找。对于邮寄调查,如果地址
不详或地址错误、公司停业或被调查者搬迁,问卷就会被邮局退还,在访问调查中也可能出现被调查者地址不详细等情况,尤其抽样框已经老化,在正式调查之前更应该对样本单元进行寻踪。
40. 严格按问卷的措辞提问:研究表明,如果调查员没有完全准确的按问卷措辞去提问,
那么很细微的措辞变化都可能会使被调查者的回答发生改变,可能会歪曲设计的原
意而造成偏差。因此在实施调查中,调查员必须严格按照问卷的要求来提问,绝对不能按照自己的理解来修改问卷中的问题的提法。
41. 当调查涉及到机密信息时,调查员不应该要求被调查者当着其他人回答。如果被调
查者有客人在场。调查人员应该与被调查者另约时间在访问,或者另选私人场所进
行访问。寄宿者、租宿者和未成年的孩子,可能会要求避开其他家庭成员单独接受访问。
42. 最后一点应值得注意的是调查人员要保护自己的人身权利。如果受到辱骂、口头恐吓、身体骚扰、或暴力等威胁,调查人员应该立即撤退并向督导和有关领导报告。 43. 为了避免花过多的时间和经费审核那些对最后的估计并无太大影响的数据,建议进
行选择性审核。选择性审核基于这样一种思想,即:只有那些审核中发现的“关键”问题而不是所有问题,才需要采取相应的处理措施。选择性审核一般适合于定量数据。