利用对应分析模型分析某人群年龄与三高发病率的关系
黄鹏 韩丁 袁源 杜金英 李延
摘要 目的随着社会的发展,生活水平的提高,“三高”发病率逐年升高,本文旨在通过统计分析,研究年龄与高血脂、高血糖、高血压发病率的关系。方法本文将利用对应分析和多重对应分析的方法,从统计学意义上的“相关”切入,直观地显示年龄和“三高症”各项指标的差异并用多重对应分析研究高脂血症、高血压、高血糖之间的相关关系,达到探讨年龄与“三高症”之间及三高之间相关关系的目的。结果 该人群高血脂发病率很高,且从30岁开始,高血脂患病率急增;高血压发病率在各年龄段较稳定;高血糖具有明显的老年偏好且高血糖发病率最低;高血脂、高血压、高血糖是具有相关关系的。结论高血脂、高血压、高血糖与年龄有关;高血脂、高血压、高血糖之间有较强的相关性。 关键词 三高,高血脂,高血压,高血糖,对应分析
高血压、高血糖、高血脂统称为“三高”,是心脑血管发病的主要因素。近20年来,我国高脂血症、高血压、高血糖发病率呈明显上升趋势。在中国人的十大死亡原因中,与“三高”相关的死亡人数也占总死亡人数的27%。随着社会的发展,生活水平的提高,以“三高症”为代表的现代文明病,出现了低龄化趋势。这与现在的年轻人高热量、高脂肪饮食,生活压力大,生活没有规律,不注重运动、肥胖等有关。那么,研究年龄与“三高症”就有了切实的意义。“三高症”是否已经“低龄化”,“三高症”在什么年龄发病率高,这些都亟待研究。
一、研究对象 1.1 数据来源
数据来源于某的体检结果,包括1035人次的年龄、身高、体重、体质指数、体脂肪率、肌肉量、骨重、甘油三酯、总胆固醇、高密度脂蛋白、低密度脂蛋白、血压和葡萄糖共十三组体检项目的结果。
体检数据获得包括仪器检测(身高、体重、收缩压和舒张压)和实验室监测(甘油三酯、总胆固醇、高密度脂蛋白、低密度脂蛋白和血糖)两部分,并收集
研究对象的姓名、性别、身高、体重、年龄、血液生化指标、自述病史、用药史等信息。
1.2 数据标准
关于各项体检数据的“正常”标准,本文依据如下: 体质指数:根据世界卫生组织拟定的世界标准定为18—25;
甘油三酯(TG):根据《中国成人血脂异常防治指南(2007年)》,中国人血清TG的合适范围是<1.70mmol/L(150mg/dl);
总胆固醇(TC):根据《中国成人血脂异常防治指南(2007年)》,中国人血清TC的合适范围是<5.18mmol/L(200mg/dl);
高密度脂蛋白(HDL):根据《中国成人血脂异常防治指南(2007年)》,中国人血清HDL的合适范围是>1.04mmol/L(40mg/dl);
低密度脂蛋白(LDL):根据《中国成人血脂异常防治指南(2007年)》,中国人血清LDL的合适范围是<3.37mmol/L(130mg/dl);
葡萄糖:根据《WHO糖尿病专家委员会报告(1999年)》,空腹静脉血浆血糖浓度6.1—6.9mmol/L。
二、统计方法
对应分析是用于寻求样品和变量之间联系的一种低维图形表示法,它可以从直觉上揭示出同一分类变量的各个类别之间的差异,以及不同分类变量各个类别的对应关系。本研究利用对应分析来直观的显示年龄和“三高症”各项指标的差异并用多重对应分析研究高脂血症、高血压、高血糖之间的相关关系。
三、结果
3.1年龄与高血脂相关关系
表1 高血脂在不同年龄段的分布
20岁以下
20至25岁 25至30岁 30至35岁 35至40岁 40至45岁 45至50岁
高血脂 1 0 41 202 175 155 32
血脂正常 0 6 35 91 97 68 11
50岁以上 12 3
从上表可以看出,从30岁开始,高血脂患病率急增。而且,高血脂发病率很高,这与现代生活饮食具有较大关系。
进行对应分析,作处理后得到以下三种形式:
图1 图2 图3
由图1可以得到,“25岁至30岁”更偏好“血脂正常”, “30岁至35岁”更偏好“高血脂”, “35岁至40岁”更偏好“血脂正常”, “40岁至45岁”更偏好“高血脂”, “45岁至50岁”更偏好“高血脂”,“50岁以上”更偏好“高血脂”。
由图2可以得到和图1相同的结论:“25岁至30岁”和“35岁至40岁”更偏好“血脂正常”, 其他更偏好“高血脂”。
由图3看出,“血脂正常”和“ 高血脂”极其不相似(夹角为180度);“25岁至30岁”和“35岁至40岁”相似。
3.2年龄与高血压相关关系
表2 高血压在不同年龄段的分布
20岁以下
20至25岁 25至30岁 30至35岁 35至40岁 40至45岁 45至50岁 50岁以上 高血压 1 4 31 128 135 103 25 8 血压正常 0 2 45 165 137 120 18 7 从上表可以看出,高血压发病率在各年龄段较稳定,并且在每个年龄段均比
高血脂低。
进行对应分析,作处理后得出三种形式:
图4 图5 图6
由图1可以得到,“25岁至30岁”更偏好“血压正常”, “30岁至35岁”更偏好“血压正常”, “35岁至40岁”更偏好“高血压”, “40岁至45岁”直观无法得到, “45岁至50岁”更偏好“高血压”。
由图2可以得到和图1相同的结论:“25岁至30岁”和 “30岁至35岁”更偏好“血压正常”, “40岁至45岁”直观无法得到, 其他年龄更偏好“高血压”。
由图3看出,“血压正常”和“ 高血压”极其不相似(夹角为180度);“25岁至30岁”和“30岁至35岁”相似。“35岁至40岁”和“45岁至50岁”相似。
3.3年龄与高血糖相关关系
表3血糖在不同年龄段的分布
20岁以下
20至25岁 25至30岁 30至35岁 35至40岁 40至45岁
高血糖 0 0 0 0 0 0
血糖正常 0 0 11 50 56 53
进行对应分析,处理后得到以下三种形式:
图7 图8 图9
由图7可以得到,“20岁以下” 更偏好“血糖正常”、 “20岁至25岁”更偏好“血糖正常”, “25岁至30岁”更偏好“血糖正常”, “30岁至35岁”更偏好“血糖正常”, “35岁至40岁” 直观无法得到, “40岁至45岁” 更偏好“高血糖”, “45岁至50岁”更偏好“高血糖”, “50岁以上”更偏好“高血糖”。
由图8可以得到和图1相同的结论:“20岁以下”、 “20岁至25岁”、 “25岁至30岁”、“30岁至35岁”更偏好“血糖正常”, “35岁至40岁” 直观无法得到, 其他更偏好“高血糖”。
由图9看出,“血糖正常”和“ 高血糖”极其不相似(夹角为180度); 35岁以下相似。40岁以上相似。
3.4利用多重对应分析了解高血脂、高血压、高血糖之间的关系。
表4 列联表
<25 25—30 30—35 35—40 40—45 45—50 >50 体重过轻 体重过重 甘油三酯升高 甘油三酯正常
<25 467 0 0 0 0 0 0 268 199 356 111
25—30 0 5 0 0 0 0 0 5 0 5 0
30—35 0 0 21 0 0 0 0 21 0 21 0
35—40 0 0 0 19 0 0 0 19 0 19 0
40—45 0 0 0 0 23 0 0 23 0 23 0
45—50 0 0 0 0 0 12 0 12 0 12 0
>50 0 0 0 0 0 0 316 120 196 253 63