多因素分析 案例

2018-12-27 19:35

多因素分析 案例

案例1 某医生为研究乳腺癌彩超血流显像的相关因素,检测了121例乳腺癌患者,其中血流丰富者68个,中等血流者48个,无血流者5个。选择患者的年龄、乳腺癌的大小、组织学分类、导管内癌和浸润性导管癌组织学分级及雌激素受体,孕酮受体等因素,进行了多因素logistic回归分析。结果显示,对血流程度有影响的因子,其作用从大到小依次为:肿块大小(OR=5.931),肿块分好程度(低分化OR=4.318,中分化OR=1.681),患者年龄(OR=0.949)。其余因素对血流程度无影响。

问题:

本案例中的涉及到了哪些变量?分别属于什么类型?因变量自变量分别是什么? 本案例可否用直线相关或者回归分析?为什么?

在进行多因素logistic回归前,是否应该先进行单因素分析?如何分析?

单因素logistic回归分析与多因素logistic回归分析有何区别?能否直接做多因素logistic回归分析?

得到logistic回归分析结果后,如何解释?如何应用这个结果?

案例2 某研究者观察了确诊后采取同样方案进行化疗的26例急性混合型白血病患者,欲了解某种不良染色体是否会影响患者病情的缓解,于是将治疗后120天内症状是否缓解作为结果变量y(缓解=0,未缓解=1),有无不良染色体chr(有=1,无)作为研究因素,数据收集后(详细数据见表19-5)进行一系列统计分析,请结合以下问题,对分析结果进行恰当的评价。

1

表19-5 急性混合型白血病患者化疗后观察数据

age 28 33 35 39 40 42 42 43 44 44 44 45 47

bl 0 1 0 0 0 0 1 0 0 0 0 1 0

cd 0 1 0 0 0 0 1 1 0 0 1 0 0

chr 1 1 1 1 1 1 0 1 1 1 1 0 1

sex 0 1 0 0 0 0 1 1 0 0 0 0 0

t 3 120 7 5 16 2 120 120 4 19 120 108 18

y 0 1 0 0 0 0 1 1 0 0 1 0 0

age 48 48 48 49 54 55 57 60 61 62 62 63 74

bl 1 1 1 1 1 0 1 1 0 0 0 1 0

cd 0 0 0 0 1 1 1 1 1 0 1 1 0

chr 1 1 1 0 0 0 0 0 1 1 1 0 1

sex 1 0 0 0 0 1 1 1 0 0 0 0 0

t 15 120 120 120 120 12 116 109 40 16 118 120 7

y 0 1 1 1 0 0 0 0 0 0 0 1 0

(1)按照有无不良染色体分组比较缓解率,考虑到例数较小,采用Fisher精确概率法,得到P值为0.667,此时的结论如何?

(2)考虑到有无不良染色体并非研究人员可以随机分配的处理,所以比较组之间其它影响患乾缓解的因素不一定均衡,因而需要考虑平衡其他可能的影响因素的作用。于是该研究者进一步查阅了相关文献,追加记录了患者的年龄age(岁)、骨髓原幼细胞数分组bl(大于等于50%=1,小于50%=0)、CD34表达式cd(阳性=1,阴性=0)、性别sex(男=1,女=0)这几个变量(数据见表19-5),采用多因素logistic模型分析,经逐步法近α=0.10水准得到表19-6中的结果。此时的结论又如何?

表19-6 急性混合型白血病患者化疗后观察数据的逐步logistic回归分析结果

Bl 常数项

回归系数 -2.054 -1.872

标准误 0.971 0.760

X2 4.472 6.073

自由度 1 1

P值 0.034 0.014

RR 7.800 0.154

综合上述分析过程,你对此项研究的设计、资料收集及统计分析方法的选择有何评论?

案例3 某研究者为探讨帕金森病(PD)与吸烟的关系,采用以人群为基础的病例-对照研究,调查某市PD病例共114例,以及对照205例(性别、民族及居住于与病例相匹配)。采用非条件logistic回归分析,结果见表18-12。请根据所提供信息,分析该研究中存在的主要统计学缺陷。

2

表18-12 PD与吸烟关系的非条件logisti回归分析

变量 性别 年龄

吸烟年限 喝茶 饮酒

回归系数 0.936 0.030 -0.619 -1.616 -0.031

标准误 0.0298 0.299 0.315 0.283 0.339

Wald X2 9.821 4.612 3.866 32.619 0.009

P值 0.009 0.032 0.049 0.000 0.926

OR 2.549 1.031 0.538 0.199 0.969

OR的95%CI 1.420,4.579 0.573,1.852 0.290,0.346 0.114,0.346 0.499,1.884

案例4 为探讨超重和肥胖对高血压病的影响,2004年,某研究者采用整群抽样的方法,对某地6个镇35周岁以上的常住人口进行高血压普查,同时收集了身高、体重等相关信息。体质指数BMI≥25判为“超重或肥胖”,BMI<5为“正常”;收缩压≥140mmHg和(或)舒张压≥90mmHg判为“高血压”。整理后资料见表18-13。 自变量X为体质指数,X=1表示“超重或肥胖”,X=0表示“正常”;因变量Y为是否患病, Y=1表示“患病”,Y=0表示“未患病”。X对Y影响的单因素logistic回归结果见表18-14。请问该二分类单因素logistic回归所得OR值与采用2*2表所计算的OR有何关系?

表18-3 不同体质指数高血压患病率 体质指数 (X)

超重或肥胖 (X=1暴露) 正常

(X=0非暴露) 合计

调查人数

患病 (Y=1 病例) 1656(a) 1331(c) 2987

未患病 (Y=0 对照) 2492(b) 5461(d) 7953

患病率 (%) 39.92 19.60 27.30

4148 6792 10940

表18-4 非条件logistic回归分析结果

Variables in the EquationB1.003-2.415S.E..044.069Wald518.6661229.351df11Sig..000.000Exp(B)2.726.08995.0% C.I.for EXP(B)LowerUpper2.5012.972Stepa1XConstanta. Variable(s) entered on step 1: X.

案例5 某医生在河南平顶山煤矿区人群糖尿病(DM)现况调查基础上,对筛选出的174例糖尿病病例和3066例糖耐量正常者进行以人群为基础的病例-对照研究。调查内容包括性别、年龄、糖尿病史、肥胖、体力劳动、饮酒和饮食等因素,分析目的主要是糖尿病者是否与肥胖有关。该医生应用单因素的分析方法,分别估计暴露于各危险因素的糖尿病患病优势比,对优势比假设检验和区间估计。分析结果表明糖尿病患病与年龄、糖尿病史、

3

体质指数(BMI)、腰臀比值(WHR)、舒张压、多食高粱豆类、职业体力劳动等的关联有统计意义。该医生应用非条件logistic回归分析糖尿病发生与各种危险因素的关联性,先做糖尿病患病与逐个因素的单因素logistic回归结果摘要在表18-6中。然后将单因素分析有统计学意义的危险因素引入多因素logistic回归模型进行逐步筛选,筛选结果列在表18-7中,结果表明,年龄大、母亲有糖尿病史、同胞有糖尿病史、最重时体质指数(BMI)高、腰臀比值(WHR)高、舒张压高、多食高粱和豆类可能是糖尿病的独立危险因子;职业性体力活动强度高和多食浅色蔬菜可能是糖尿病患病的独立保护因子。 讨论:

(1)该研究在设计方面存在什么问题? (2)该资料的统计分析存在什么问题?

(3)什么因素可能影响糖尿病与肥胖的关系,在该研究设计中存在哪些可能的混杂因素? (4)如何校正混杂因素的影响?

(5)目前的统计分析程序存在什么问题?

(6)如何应用logistic回归校正混杂因素的影响?

(7)如何根据研究目的估计校正混杂因素后糖尿病与肥胖的关联?

表18-6 非条件logistic回归单因素分析结果

变量 性别

居住年限 子女有DM 现进BMI 现时WHR 职业性体力活动 舒张压 小米 豆类 鲜奶

浅色蔬菜 两年前动物油

OR 0.52 1.58 8.95 3.35 5.91 0.71 3.28 1.64 1.47 1.52 0.51 0.78

OR的95%CI 0.38-0.71 1.24-2.03 2.22-36.08 2.41-4.65 4.05-8.63 0.63-0.80 2.27-4.48 1.24-2.18 1.19-1.82 1.10-2.10 0.37-2.74 0.97-0.91

变量 年龄

母亲DM史 同胞DM史 最重时BMI 饮酒指数 收缩压 大米 高粱 禽肉 豆制品 动物油 月经

OR 2.44 5.93 4.99 4.44 0.67 3.89 0.11 2.96 1.30 1.27 0.78 1.80

OR的95%CI 2.08-2.87 3.25-10.82 2.44-10.21 3.01-6.56 0.47-0.96 2.39-6.33 0.03-0.45 1.35-6.52 1.02-1.66 1.03-1.06 0.66-0.91 1.38-2.36

表18-7 非条件logistic回归多因素分析结果及各危险因子的PAR%值

变量 年龄

母亲DM史 同胞DM史 职业性体力活动

最重时BMI 现进BMI 舒张压 高粱 豆类

浅色蔬菜

回归系数 0.7134 1.7984 0.8069 -0.1191 0.6135 0.9437 0.4111 0.7988 0.2211 -0.6935

标准误 0.0900 0.3613 0.4349 0.0689 0.2255 0.2207 0.2507 0.2951 0.1187 0.1974

标准回归系数 0.4242 0.1369 0.0532 -0.0909 0.1691 0.2571 0.0670 0.0709 0.0774 -0.1202

OR 2.04 6.04 2.24 0.89 1.85 2.57 1.51 2.22 1.25 0.50

OR的95%CI 1.71-2.44 2.98-12.26 0.96-5.26 0.78-1.02 1.19-2.87 1.67-3.96 1.01-2.26 1.25-3.96 0.99-1.57 0.34-0.74

PAR% 80.04 7.19 3.18 -19.20 37.35 48.80 8.15 3.20 10.63 -269.54

4


多因素分析 案例.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:社会分层背景下社会资本与大学生就业的关系研究

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: