第一章
一、名词解释
参数:指总体中全部观察单位的观测值所得的特征值,是一个固定的常数,通常是未知的。
统计量:指由样本计算得到的反映样本资料特征的统计指标,为随机变量,取值在参数附近波动,可作为参数的估计值。
同质:指观察单位通常具有某种共性,即相同的状况或属性等,观察单位之间常常“大同小异”。
变异:指同质观察单位之间的差异。
概率:是描述随机事件发生可能性大小的一个度量,为一个固定的常数,取值在0到1之间,常用p来表示。
频率:在相同的条件下,独立地重复进行n次实验,随机事件A出现了f次,则称f/n为事件A出现的频率。
抽样误差:指由抽样引起的样本统计量与总体参数之间的差异,或者不同样本统计量之间的差异。
二、单项选择题 1.E 2.E 3.B 4.A 三、简答题
1.卫生管理统计的基本步骤一般分为统计设计、收集资料、整理资料和分析资料四个步骤。这四个步骤紧密联系,前一步是后一步的基础,每一个步骤的工作质量都会影响最终结论的正确性。
2.卫生管理统计中通常将资料分为定量资料、定性资料和等级资料三种类型。定量资料是测量每个观察单位某项指标得到定量的测量值,表现为数值大小,且有度量衡单位,如某医院出院患者的住院日。定性资料是将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料,测量值为定性的,表现为互不相容的属性或类别,如某医院住院患者中A型、B型、AB型和O型人数。等级资料是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察档位数后得到的资料,具有半定量性质,表现为等级大小,如某病患者治愈、好转、无效、死亡的人数。
5.D 6.D 7.B 8.D 9.C 10.D
第二章
一、单项选择题 1.C 2.B 3. E 4.B 二、简单题
1.利用SPSS直接建立数据库一般分为两步,第一步变量设置,在变量视图(Variable View)中完成,第二步数据录入,在数据视图(Data View)中完成。在建立数据库过程中要注意以下问题:
建立数据库之前应先确定研究中需要的指标,哪些是重要指标,哪些是次要指标,哪些是标识变量,尽量做到数据库中含有研究所需要的每一个指标,同时尽量避免冗余无用的指标。
2.数据录入基本原则一个观测的数据在一行显示,一个指标即一个变量的数据在一列显示,录入完成后产生一个标准数据格式数据集。数据录入过程中要注意尽可能用数值变量代替字符变量,便于数据录入;要有标识变量,便于核查;对于多项选择题的录入要采用多重二分法或者多重分类法,切忌将多个选项录入一个变量。
三、上机应用题 在变量视图中做以下设置
变量名 数据类型 数值型 数值型 数值型 数值型 日期型 字符型 数值型 数值型 数值型 小数点 0 0 0 0 0 0 0 0 0 变量标签 编号,标识变量 性别 民族 身份证号码 出生年月 居住地 电话(家) 电话(手机) 电话(其他) 值标签 资料类型 No Gender Nation IDno Birthd Address Tel1 Tel2 Tel3 1=男,0=女 0=汉族,1=其它 Nominal Nominal Nominal Nominal Nominal Nominal Nominal Nominal Nominal Relative A1 A2 A3 A4 A51 A52 A61 A62 A7 数值型 数值型 数值型 数值型 数值型 数值型 数值型 数值型 数值型 数值型 0 2 2 2 2 2 2 2 2 0 亲属关系 身高 体重 腰围 臀围 SBP1 SBP2 DBP1 DBP2 服用降压药 1=子,2=女,3=其它人 0=无,1=有 1=行政或其它管理,2=医护人员,3=教师,4=军警保安,5=文化艺术,6=理工技Nominal Scale Scale Scale Scale Scale Scale Scale Scale Nominal A8 数值型 0 职业 术人员,7=金融法律, 8=文员或秘书, 9=工厂工人,10=个体经营者,11=商业或服务人员,12=农民或渔民,13=家庭主妇, 14=其它, 99=不详 Nominal 注:其余各项默认即可。
第三章
一、名词解释
1.单纯随机抽样:又称简单随机抽样,是按等概率原则直接从含有N个观察单位的总体中抽取n个观察单位组成样本。单纯随机抽样是最基本的抽样方法,也是其他抽样方法的基础。优点:均数(或率)及标准误的计算简便。缺点:总体较大时抽得的样本单元很分散,给实施调查带来困难。
2.分层抽样:按与研究目的明显有关的因素(或特征),将观察单位分为若干的类型或组别(统计学上称“层”,stratum),然后从每一层中按比例抽取一定数量的观察单位组成样本。优点:抽样误差较小,样本对总体有较好的代表性;便于在不同的层内采用不同的抽样方法,有利于调查组织工作的实施;可以对各层独立进行分析。
3.非抽样误差:指除抽样误差以外的,由各种非随机因素引起的误差,主要包括抽样框误差、无应答误差和计量误差。非抽样误差成因复杂,可产生于调查
工作的各个阶段、各个环节。非抽样误差难以测度,但可以控制,比如设计科学的调查研究方案、开展预调查、调查人员严格选择与培训、加强调查实施过程的组织管理、监督和检查及资料整理录入加强编码及双录等措施均可减少非抽样误差。
二、简答题
1. 调查研究的质量控制应贯穿于调查工作的各个阶段、各个环节,比如设计科学的调查研究方案、开展预调查、调查人员严格选择与培训、加强调查实施过程的组织管理、监督和检查及资料整理录入加强编码及双录等措施,以减少非抽样误差。
2. (1)估计的容许误差。容许误差越大,估计精度越低,需要的样本量越小;反之,容许误差越小,估计精度越高,需要的样本量越大。(2)估计的置信度。置信度要求越高,即?的取值越小,则样本含量要求越大。置信水平一般取95%。(3)总体的变异程度。当总体率?越接近0.5,变异程度越大,需要样本量越大;?值偏离0.5越远,变异程度越小,样本量越小。(4)应答率。在估算样本量时通常需要根据可能的应答率增加样本量。设估算出的样本量为
n0,应答率为pr,则校正的样本量为n?n0/pr。(5)设计效率。在估算样本量时,应考虑复杂抽样设计的设计效率对研究结果的影响,一般先按照单纯随机抽样设计估计出初始样本量,再乘以设计效率Deff得到最终的样本量。
3. 抽样调查中的误差有两大类:抽样误差和非抽样误差。
抽样误差是由于抽样使样本统计量与总体参数之间的差异。由于每次抽取样本所包含的观察单位是随机的,所以,不同样本之间以及样本与总体之间会存在偏差,由此产生了抽样误差。非抽样误差产生比较复杂,有以下几类:由于抽样框不完善导致的抽样框误差;由于调查获得的数据与所欲调查项目的真值之间不一致而导致的计量误差;由于无应答导致的无应答误差等。非抽样误差不仅在抽样调查中,在全面调查中也是存在的。
三、选择题
1. D 2. E 3. B 4. B 5. E 6. D 7. A 8. B 四、应用题
代入公式(3-11)??0.2,??0.02,??0.05,1. 已知,Z0.05/2?1.96,
有
2Z?1.9620.2(1?0.2)/2?(1??)n???683 22?0.03因此,需要调查683名6-11岁儿童。
2. 根据题意可以整理如下:
年龄段(岁) 18-30 31-45 46-60 60以上
根据公式(3-5)(3-6)可计算总体两周患病率的估计值及标准误:
Ni 800 1000 1200 500
ni 200 400 450 300
Wi 0.229 0.286 0.343 0.143
pi 0.086 0.182 0.356 0.463
s2pi 0.0003764 0.0003722 0.0005095 0.0008288
p??Wipi=0.229*0.086+0.286*0.182+0.343*0.356+0.143*0.463=0.259
sp?=
ni22?(1?N)Wispii 20030022(1?)0.2290.0003764???(1?)0.1430.0008288800500=0.008785
两周患病率的95%置信区间为(0.259-1.96×,0.008785, 0.259+1.96×0.008785) 即(0.242,0.276)。
因此,该居民社区总的两周患病率为25.9%,95%置信区间为(24.2%,。 27.6%)
第四章
一、单项选择题
1.A 2.A 3.D 4.C 5.C 6.E
二、简答题