流行病学（全本）(5)

2019-01-07 18:03

队列研究结束后，也应对所获得的资料进行整理，然后进行描述性分析，将研究对象的组成、随访的经过、结局的发生和失访率等情况作出描述。再按年龄、性别、时间分别计算各研究组在随访期的疾病发病率和死亡率，然后进行比较。

（一）率的计算

队列研究可以计算多种率，特别是能计算发病率，这是病例对照研究不可比拟的优点，因为病例对照研究无法得到病例所来自的人群的基准人口数，故无法计算发病率、患病率、死亡率等指标。

1.累积发病率（cumulative incidence， CI）某一固定人群在一定时期内某病新发生例数与时期开始总人数之比，也就是一般所说的发病率。随访期越长，则病例发生越多，所以CI表示发病率的累积影响。CI又是平均危险度的一个指标，也就是一个人在特定时期内发生该病的概率。

（1）累积发病率的适用条件：样本量大，人口稳定，资料比较整齐。（2）计算公式，设观察期限为n年。

n年内的平均暴露人口数

暴露组与非暴露组间率的差异要进行统计学检验。当发病率高时，可用u检验。如果n年的某病累计发病率?n年内的新发病例数?1000000(100,000/10万)发病率比较低，则改用二项分布或泊松分布检验。检验方法查阅有关统计学书籍。

2.发病密度（incidence density，ID）发病密度是一定时期内的平均发病率。其分子仍是一个人群在期内新发生的例数，分母则是该人群的每一成员所提供的人时的总和。所谓人时（person-time，PT）是观察人数乘以随访单位时间的积。发病密度既说明了该人群发生的新病例数，又说明该人群的大小和发生这些例数所经历的时间。时间单位常用年，故又称人年数（person-years）。一定的人时（人年）数可来自不同的人数与不同的观察时间，例如100人年可来自100人观察一年，或50人观察2年，或200人观察0.5年。

（1）发病密度适用条件：没有限制，一般队列研究均可用，但因其计算比较复杂，故多在人口波动较大、样本量小的情况下，不能用累积发病率时应用发病密度。

（2）计算公式：

观察期内的观察对象人年数

人年数的计算请参见有关统计书。发病密度?某人群在观察期内的发病数?100,000/10万

3.标化比

（1）适用条件：样本量小，发病率或死亡率低（2）常用指标及其计算公式：

标化比中最常用的指标为标化死亡比（standardized mortality ratio， SMR），它是以全人口死亡率作标准，算出观察人群的理论死亡数，再用实际死亡数与之比较而得出，

SMR?研究人群实际死亡数该人群理论死亡数?研究人群实际死亡数暴露人口数?全人口死亡率

如果SMR>1，则暴露人群的死亡率大于一般人群。

例2. 某工厂有32745人，某年死于肺结核的为12人，而一般人群的肺结核死亡专率为9.8/10万，则

SMR=12/（32745×9.8/100000）=12/3.209=3.74 即该工厂结核病的死亡危险是一般人群的3.74倍。

（二）暴露与疾病的关联分析

首先将观察结果列成如表2，然后进行分析。

表2 队列研究资料归纳表

组别暴露组非暴露组合计

1.相对危险度或率比

（1）定义：相对危险度（relatire risk，RR）或率比（rate ratio）是指暴露组发病率与非暴露组的发病率之比，它反映了暴露与疾病的关联强度。

（2）计算公式：

Ioc/(c?d)

（3）RR的意义：RR说明暴露使个体发病的危险比不暴露高多少倍，或者说暴露

RR?Ie?a/(a?b)病例 a c a+c=m1

非病例 b d b+d=m0

合计 a+b=n1 c+d=n0 n

发病率 Ie=a/n1 Io=a/n0

组的发病危险是非暴露组的多少倍。

（4）RR的95%可信区间：

RRU,RRL?RR21?1.96?2

m1.m0.n1.n0

RR的95%可信区间的另一算法为：

标准差（SD）?1/a?1/b，??2(ad?bc).n RR的95%可信区间为exp[lnRR?1.96(SD)]

相对危险度（RR）无单位，比值范围在0至∞之间。RR=1，表明暴露与疾病无联系；RR<1，表明其间存在负联系（提示暴露是保护因子）；反之RR>1时，表明两者存在正联系（提示暴露是危险因子）。比值越大，联系越强。实际上，0与∞只是理论上存在的值，恰恰等于1也不多见。极强的联系既无须用流行病学研究去检测，极弱的联系也不大可能用非实验性的流行病学观察法检测出来。

2.归因危险度或率差

（1）定义：归因危险度（attributable risk，AR）或率差（rate difference）是指暴露组发病率与非暴露组发病率之差，它反映发病归因于暴露因素的程度。

（2）计算公式：

AR?Ie?Io?aa?b?cc?d?2?Io(RR?1)

AR的95%CI?AR1?1.96/（3）AR的意义：AR表示暴露可使人群比未暴露时增加的超额发病的数量，如果暴露去除，则可使发病率减少多少（AR的值），因此AR在疾病预防中很有意义。

3.归因危险度百分比（AR%）或病因分值（EF） AR%是指暴露人群中由暴露因素引起的

发病在所有发病中所占的百分比。

AR%?Ie?IoI?100%?RR?1RR?100%e

当AR%>75%时，即可认为按到了主要病因。

4.人群归因危险度（PAR）与人群归因危险度百分比（PAR%）

（1）PAR：又称病因分值（etiologic fraction， EF）表示在全人群中，由于暴露而导致的发病率的增加，

PAR=It－Io It:全人群发病率。

（2）PAR%：表示全人群中由暴露所引起的发病在全部发病中的比例，

PAR%?It?IoIt?100%

有时，队列研究的资料还需进行分层分析和剂量反应关系分析，请参照病例对照研究中的相关内容，两者方法和意义相似。

例3. 某吸烟与肺癌的队列研究获得以下资料，试计算上述各指标。吸烟者肺癌年死亡率为Ie=0.96? 非吸烟组肺癌年死亡率为Io=0.07? 全人群中肺癌年死亡率为It=0.56?

则：RR=Ie/Io=0.96?/0.07?=13.7，表明吸烟组的肺癌死亡危险是非暴露组的13.7倍； AR= Ie-Io=0.96?-0.07?=0.89?，表明如果去除吸烟，则可使肺癌死亡率减少0.89?；

AR%=（Ie-Io）/ Ie×100%=92.7%，表明吸烟人群中由吸烟引起的肺癌死亡在所有肺癌死亡中所占的百分比为92.7%

PAR= It-Io=0.56?-0.07?=0.49?，表明如果去除吸烟，则可使全人群中的肺癌死亡率减少0.49?；

PAR%=（It-Io）/ It×100%=87.5%，表明全人群中由吸烟引起的肺癌死亡在所有肺癌死亡中所占的百分比为87.5%。

（三）队列研究的结果解释

队列研究可以计算发病率和RR，因此其可信度比病例对照研究和生态学研究高，可以确定因果关系。在计算出RR值后可参照表3，对其关联强度进行判断，但也须作χ检验和计算RR的95%可信区间，确信有统计意义时才能得出结论。RR对病因推断意义较大，与之相比AR则在预防疾病意义更大一些，AR和PAR可以直接反映去除该危险因素后可使发病率下降多少。AR%则对于寻找主、次病因有一定意义。另外队列研究的结果解释必须与实际情况相结合综合作出判断。

表3 RR值的关联强度参考表

2RR值

0.9~1.1

0.7~0.8或1.2~1.4 0.4~0.6或1.5~2.9 0.1~0.3或3.0~9.0

<0.1或>9.0

关联强度

无弱

中等

强很强

（Monson RA ，1980）

第六节队列研究中的偏倚及其防止

(一)常见的偏倚

1.选择偏倚(selection bias) 任何非研究因素在研究人群中与一般人群中的分布不一致，均可引起选择偏倚，如年龄、种族等。最理想的研究样本人群应当是总人群的一个无偏样本。但是由于最初选定的研究对象有人不能参加了；进行历史性队列研究时，有些人的档案丢失或记录不全；研究对象为志愿者，他们往往是具有某些特征或习惯的；某些早期病人在研究开始时未能发现；或暴露与疾病的定义不严格，执行不当等，都可能造成研究对象的选择偏倚。

2.失访偏倚(lost to follow-up) 在研究过程中，某些选定的研究对象因为种种原因脱离了观察，研究者无法继续随访他们，这种现象叫失访，因此而造成对研究结果的影响称为失访偏倚。队列研究由于观察人数较多，观察时间较长，失访是不可避免的。主要原因是研究对象迁移、外出、不愿再合作而退出或死于非终点疾病。失访所产生的偏倚的大小主要取决于失访率的大小和失访者的特征以及暴露组与非暴露组两组失访情况的差异，对研究结果产生偏倚影响最大的是\高危人群\的失访。失访率一般不应超过10%。

3.信息偏倚(information bias) 队列研究中的信息偏倚主要是错分偏倚(misclassificationbias)，包括暴露错分和疾病错分以及暴露与疾病的联合错分。主要原因是使用的仪器不准确，检验技术不熟练，诊断标准定义不明确或掌握不当，询问技巧欠佳造成结果不真实等。若这种错分偏倚以同样的程度发生于观察的各组，则结果可能不会对各组之间的相对关系产生太大影响，但相对危险度的估计趋向于1，即会低估相对危险度，这种情况叫做非特异性错分。若这种错分发生于一组而不发生于另一组，则对相对危险度的估计的影响不确定，这种情况叫做特异性错分。

4.混杂偏倚(confounding bias) 队列研究中同样会发生混杂偏倚。当我们研究某个因素与某种疾病的关联时，由于某个既与疾病有制约关系，又与所研究的暴露因素有联系的外来因素的影响，掩盖或夸大了所研究的暴露因素与疾病的联系。这种现象或影响叫混杂（confounding），其所带来的偏倚叫混杂偏倚（confounding bias），该外来因素叫混杂因素（confounding factor）

(二) 偏倚的控制

1．选择偏倚严格按规定的标准选择研究对象，特别要弄清愿意加人和不愿意加入研究的两组人有哪些不同特点，了解这些特点有助于全面合理地解释研究结果。

2．失访偏倚控制失访偏倚主要靠尽可能提高研究对象的依从性，在选择研究对象时选择那些符合条件并且依从性好的研究对象。当失访率大于10%时，对于失访可能的影响应当做进一步估计：①首先比较两组失访率的差别及不同程度暴露组失访率的差异；②比较失访人群与随访到的人群的某些基本特征有无差别，如果这两点差别不大，则可认为失访是随机的，对于研究结果的影响可能不大，只是减少了样本量；③还可以从各种途径了解失访者的最后结局，与被随访到的人群的结局进行比较，以推测失访的影响。如果失访率达到20%以上则该次研究的真实性值得怀疑。

3．信息偏倚主要是提高设计水平和调查质量，做好质量控制工作。明确各项标准，严格按规定执行，采取定期抽取一定比例的样本复查等方法可减少信息偏倚。

4．混杂偏倚在设计时利用限制和匹配的方法；资料分析时可采用分层分析或多因素分析模型处理。

第七节队列研究的优缺点

（一）队列研究的优点

1. 在疾病发生前按是否暴露于某因素分组，所获资料完整，无回忆偏倚； 2. 可计算暴露组和非暴露组的发病率，能测量两组间的特异危险度和相对危险度； 3. 一次调查和观察多种结果，如在调查吸烟与肺癌关系时，可同时调查吸烟与支气管炎、肺气肿、冠心病等的关系，并能了解疾病的自然史；

4. 能直接估计因素与发病的联系强度，且先因后果，时间关系明确，所得联系比较确实可靠；

5. 暴露因素的作用可分等级，便于计算“剂量-反应关系”； 6. 样本量大，结果稳定；

7. 在有完整资料记录的条件下，可作回顾性定群研究，省时省力，出结果较快。（二）队列研究的缺点

1. 观察时间长、费人力、花费高，不能在较短时间内得到结果； 2. 准备工作较繁重，设计的科学性要求高，实施难度大； 3. 暴露人年计算工作量较为繁重；

4. 研究罕见病时，需要大量研究对象，因而不易收集到完整可靠的资料，故不适用于罕见病；

5. 每次只能研究一个或一组因素，因此不适用于多病因的疾病。

第五章、病例对照研究第一节、基本原理

一、概念

选定患有某病和未患某病的人群，分别调查其暴露(如环境因素、遗传因素、内分泌作用以及保护因子的缺乏等)于某个危险因子的情况及程度，以判断暴露危险因子与某病有无关联及关联程度大小的一种观察研究方法。二、特点

1、从果到因的研究

2、由回顾调查获得暴露资料

3、一次病例对照研究可以研究许多因素

4、病例对照研究的本质符合队列研究设计原理第二节、病例对照研究的分类（一）、按目的分类：探索性的、检验性的（二）、按设计分类： 1、病例对照不匹配：

2、病例对照匹配：

（1）频数匹配（frequency matching)要求配比的因素所占的比例，两组一致。

（2）个体配比（individual matching)以个体为单位匹配。 3.、病例对照研究的衍生类型

（1）.巢式病例对照研究(nested case-control study) （2）.病例-队列研究（case-cohort study）（3）.单纯病例研究（case only study）

（4）.病例交叉研究 (case-crossover design)。

共8页:

流行病学（全本）(5).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档